Treoir thapa ar chomhad Robots.txt a scríobh

Conas a théann tú i gcomhairle le téacsleabhar ollmhór? Scagadh tríd an innéacs. Bhuel: tá gné amháin ann arb é an fíor-achoimre ar do shuíomh Gréasáin…

Robots.txt: Beidh cóid ríomhchlárúcháin faoi cheangal a bheith níos mó agus níos sofaisticiúla
Tá na cóid ríomhchlárúcháin le bheith níos sofaisticiúla i gcónaí

Is é an t-aon bhealach chun dul i dteagmháil leis an damhán alla inneall cuardaigh, nó an crawler, is trí chomhad ar a dtugtar robots.txt. Nó níos fearr. Nuair a chuireann tú do thogra suíomh Gréasáin faoi bhráid Google, bíonn ort méid ollmhór faisnéise.

Conas a théann tú i gcomhairle le téacsleabhar atá chomh mór sin go mbraitheann tú nach bhfaighidh tú gach rud atá uait go deo? Téann tú i gcomhairle an leid. Bhuel: is é an comhad robots.txt innéacs do shuíomh Gréasáin.

Is doiciméad é seo atá éasca le líonadh a insíonn don inneall cuardaigh cad ba cheart a lorg. I mbeagán focal: cabhróidh tú leis a thuiscint cad as a bhfuil do shuíomh déanta, ionas gur féidir leis an algartam rangú a thabhairt duit atá ar aon dul leis an obair atá déanta agat.

An féidir le duine ar bith comhad robots.txt a scríobh?

Is é an freagra gairid ná tá. Is é an freagra macánta uimh. Cé go bhfuil gramadach an chomhaid robots.txt thar a bheith simplí, agus go bhfuil a chomhdhéanamh comhdhéanta de chúpla líne, is fearr a bheith ag brath ar chúram stiúrthóir gréasáin saineolaí a bhfuil a fhios aige cá háit a gcuirfidh sé a lámha. Tar éis an tsaoil, is leor botún beag chun suíomh do shuíomh Gréasáin a chomhréiteach, agus dá bhrí sin stop a chur le gach oibríocht Sinsearach sula dtosaíonn tú fiú.

Sula dtosaíonn tú, bíodh a fhios agat rud amháin: is féidir le duine ar bith dul i gcomhairle leis an gcomhad robots.txt ar aon suíomh trí /robots.txt a scríobh tar éis an fhearainn. Is féidir leat dul i gcomhairle le Google fiú!

Is féidir leat comhad den sórt sin a scríobh gan bogearraí speisialta a íoslódáil. Go deimhin, is leor do leabhar nótaí a úsáid agus a shábháil, buille faoi thuairim, i bhformáid .txt.

Scríobhaimis robots.txt le chéile: an ceanntásc

Let tús ón tús, mar go bhfuil sé i gcónaí loighciúil a dhéanamh. Tá oscailt an chomhaid, nó in áit an cheanntásc, tiomnaithe go hiomlán d’ainm an damháin alla, agus foclaíocht bheag roimhe a bhíonn mar a chéile i gcónaí. Glacaimid leis gur mhaith leat do Google a chur faoi deara. Mar sin beidh an chéad líne:

Gníomhaire úsáideora: Googlebot

Insíonn an teaghrán an-ghearr seo do Google gur cinnte go mbeidh gach rud a leanas ina ábhar spéise dó. Sa chás go dteastaíonn uait go mbeidh gach crawlóir a léann an cineál comhaid seo in ann an doiciméad a fheiceáil, cuir * simplí in ionad Googlebot, a réiltín.

Anois go bhfuil an damhán alla curtha in iúl agat, i.e. WHO, beidh ort a chur in iúl freisin CAD a bheidh aige a léamh.

Freagraíonn gach líne de chód, de réir sainmhínithe, do ghníomhaíocht an mheaisín. Ní gá a rá go gcomhfhreagraíonn gach ordú sa chomhad robots.txt do na rudaí nár cheart don mheaisín a dhéanamh. Agus is é seo an eochair a ligeann duit ceann fíor-éifeachtach a scríobh. Táimid ag caint faoi ordú DISALLOW.

Cad é an t-ordú DISALLOW?

Il ordú a dhícheadú ligeann duit réasúnaíocht a dhéanamh trí eisiamh. I bhfocail eile, nuair a deirtear gurb é an chéad rud a rá cad nár cheart a dhéanamh – bhuel, tá tú ag réasúnú trí eisiamh. Chomh maith leis an dícheadú tá an cead ann freisin, atá mar eisceacht don bhloc.

Más mian leat comhad robots maith a scríobh, beidh ort smaoineamh ar an mbealach eile, mar sin beidh ort insint do Google cad nár cheart dó a léamh. Má scríobhann tú:

Dícheadú:

Léifidh an damhán alla do shuíomh iomlán, gan aon choscáin.

Más rud é tar éis “Dícheadaigh:" má chuireann tú isteach slaise (Dícheadaigh: / mar sin), ní chuirfear an suíomh isteach in innill chuardaigh, lánstad.

Dícheadaigh: /eolaire/

Cuir an fillteán is mian leat a dhiúltú ó radharc damháin alla in ionad an eolaire focal. Is féidir leat an rud céanna a dhéanamh le comhad ar leith.

Dícheadaigh: /myfile.html

ATTENTION to poncaíocht agus litreacha, cás uachtair nó cás íochtair. Tá ardmheas ag an gcineál comhaid seo ar na cineálacha “trifles” seo, ach déanann siad difríocht mhór.

Cén fáth a gcuirfeá stop le Google ó chuid mhór de do shuíomh a léamh? Nuair a scríobhann tú comhad den chineál seo, tá sé tábhachtach a thuiscint cé na comhaid nár cheart a bheith ar an inneall cuardaigh, ach gan iad a mhí-úsáid. Bíodh a fhios agat, áfach, go mbeidh aon duine a bhfuil seoladh cruinn an chomhaid áirithe sin ar eolas aige nó aici in ann rochtain a fháil air in aon chás.

Cad é an t-ordú ALLOW?

Sa chomhad is féidir leat eisceacht a chur leis an ordú CEAD. Tá an ghramadach comhionann, ach cruthóidh sé roinnt eisceachtaí don DISALLOW a ligfidh do imeall taiscéalaíochta suimiúla a oscailt don damhán alla.

Comhad samplach beag:

Gníomhaire úsáideora: Googlebot

Dícheadaigh: /images/

Ceadaigh: /images/holidays.jpg

Go bunúsach dúirt muid le Googlebot gan an fillteán íomhá a mheas, ach amháin i gcás grianghraf ar leith taobh istigh de, is é sin an ceann ó na laethanta saoire.

Agus sin, guys, an bhfuil sé. Scríobhamar ár gcéad chomhad robots.txt. Cinnte, d'fhéadfadh go mbeadh an méid atáimid ag dul a dhéanamh don suíomh iarbhír beagán difriúil, ach ní i bhfad níos mó. Má tá amhras ort, faigh comhairle ó stiúrthóir gréasáin speisialaithe i gcónaí. Molaimid duit iarracht a dhéanamh é a scríobh tú féin, ar an gcéad dul síos, agus é a sheoladh chuige le haghaidh seiceála, chun na rudaí a mháistir agus tuiscint níos fearr a fháil ar conas a oibríonn do shuíomh.

Cad é an comhghaol idir robots.txt agus sitemaps?

Is comhad é an mapa suímh a ghintear le forlíontáin speisialta ina bhfuil na naisc go léir ar an láithreán. Nuair a théann an damhán alla isteach sa suíomh, léann sé na róbait ar dtús, ansin déanann sé an suíomh a chraobhscaoileadh. Más rud é go bhfaighidh an róbat seoladh léarscáil an láithreáin le linn an crawl, beidh an próiseas iomlán i bhfad níos éasca.

Cuir iad seo a leanas leis an gcód thuas:

Léarscáil an láithreáin: http://www.ilnomedeltuositobellissimo.com/sitemap.xml

I gcrích

Tá gach comhad robots mar an gcéanna. Ciallaíonn sé seo go n-oibreoidh comhad Robots a scríobhadh do Google go breá freisin do Bing, agus leanann sé an ghramadach chéanna.

Ligeann comhad robots.txt dea-eagraithe duit shábháil am crawler. Ná bíodh dímholadh ort: seo é an chéad chéim i dtreo ratha!

Robots.txt: Is é Google an t-inneall cuardaigh is cumhachtaí ar an Idirlíon
Is é Google an t-inneall cuardaigh is cumhachtaí ar an Idirlíon