Treoir thapa ar chomhad Robots.txt a scríobh
Conas a théann tú i gcomhairle le téacsleabhar ollmhór? Scagadh tríd an innéacs. Bhuel: tá gné amháin ann arb é an fíor-achoimre ar do shuíomh Gréasáin…
Is é an t-aon bhealach chun dul i dteagmháil leis an damhán alla inneall cuardaigh, nó an crawler, is trí chomhad ar a dtugtar robots.txt. Nó níos fearr. Nuair a chuireann tú do thogra suíomh Gréasáin faoi bhráid Google, bíonn ort méid ollmhór faisnéise.
Conas a théann tú i gcomhairle le téacsleabhar atá chomh mór sin go mbraitheann tú nach bhfaighidh tú gach rud atá uait go deo? Téann tú i gcomhairle an leid. Bhuel: is é an comhad robots.txt innéacs do shuíomh Gréasáin.
Is doiciméad é seo atá éasca le líonadh a insíonn don inneall cuardaigh cad ba cheart a lorg. I mbeagán focal: cabhróidh tú leis a thuiscint cad as a bhfuil do shuíomh déanta, ionas gur féidir leis an algartam rangú a thabhairt duit atá ar aon dul leis an obair atá déanta agat.
An féidir le duine ar bith comhad robots.txt a scríobh?
Is é an freagra gairid ná tá. Is é an freagra macánta uimh. Cé go bhfuil gramadach an chomhaid robots.txt thar a bheith simplí, agus go bhfuil a chomhdhéanamh comhdhéanta de chúpla líne, is fearr a bheith ag brath ar chúram stiúrthóir gréasáin saineolaí a bhfuil a fhios aige cá háit a gcuirfidh sé a lámha. Tar éis an tsaoil, is leor botún beag chun suíomh do shuíomh Gréasáin a chomhréiteach, agus dá bhrí sin stop a chur le gach oibríocht Sinsearach sula dtosaíonn tú fiú.
Sula dtosaíonn tú, bíodh a fhios agat rud amháin: is féidir le duine ar bith dul i gcomhairle leis an gcomhad robots.txt ar aon suíomh trí /robots.txt a scríobh tar éis an fhearainn. Is féidir leat dul i gcomhairle le Google fiú!
Is féidir leat comhad den sórt sin a scríobh gan bogearraí speisialta a íoslódáil. Go deimhin, is leor do leabhar nótaí a úsáid agus a shábháil, buille faoi thuairim, i bhformáid .txt.
Scríobhaimis robots.txt le chéile: an ceanntásc
Let tús ón tús, mar go bhfuil sé i gcónaí loighciúil a dhéanamh. Tá oscailt an chomhaid, nó in áit an cheanntásc, tiomnaithe go hiomlán d’ainm an damháin alla, agus foclaíocht bheag roimhe a bhíonn mar a chéile i gcónaí. Glacaimid leis gur mhaith leat do Google a chur faoi deara. Mar sin beidh an chéad líne:
Gníomhaire úsáideora: Googlebot
Insíonn an teaghrán an-ghearr seo do Google gur cinnte go mbeidh gach rud a leanas ina ábhar spéise dó. Sa chás go dteastaíonn uait go mbeidh gach crawlóir a léann an cineál comhaid seo in ann an doiciméad a fheiceáil, cuir * simplí in ionad Googlebot, a réiltín.
Anois go bhfuil an damhán alla curtha in iúl agat, i.e. WHO, beidh ort a chur in iúl freisin CAD a bheidh aige a léamh.
Freagraíonn gach líne de chód, de réir sainmhínithe, do ghníomhaíocht an mheaisín. Ní gá a rá go gcomhfhreagraíonn gach ordú sa chomhad robots.txt do na rudaí nár cheart don mheaisín a dhéanamh. Agus is é seo an eochair a ligeann duit ceann fíor-éifeachtach a scríobh. Táimid ag caint faoi ordú DISALLOW.
Cad é an t-ordú DISALLOW?
Il ordú a dhícheadú ligeann duit réasúnaíocht a dhéanamh trí eisiamh. I bhfocail eile, nuair a deirtear gurb é an chéad rud a rá cad nár cheart a dhéanamh – bhuel, tá tú ag réasúnú trí eisiamh. Chomh maith leis an dícheadú tá an cead ann freisin, atá mar eisceacht don bhloc.
Más mian leat comhad robots maith a scríobh, beidh ort smaoineamh ar an mbealach eile, mar sin beidh ort insint do Google cad nár cheart dó a léamh. Má scríobhann tú:
Dícheadú:
Léifidh an damhán alla do shuíomh iomlán, gan aon choscáin.
Más rud é tar éis “Dícheadaigh:" má chuireann tú isteach slaise (Dícheadaigh: / mar sin), ní chuirfear an suíomh isteach in innill chuardaigh, lánstad.
Dícheadaigh: /eolaire/
Cuir an fillteán is mian leat a dhiúltú ó radharc damháin alla in ionad an eolaire focal. Is féidir leat an rud céanna a dhéanamh le comhad ar leith.
Dícheadaigh: /myfile.html
ATTENTION to poncaíocht agus litreacha, cás uachtair nó cás íochtair. Tá ardmheas ag an gcineál comhaid seo ar na cineálacha “trifles” seo, ach déanann siad difríocht mhór.
Cén fáth a gcuirfeá stop le Google ó chuid mhór de do shuíomh a léamh? Nuair a scríobhann tú comhad den chineál seo, tá sé tábhachtach a thuiscint cé na comhaid nár cheart a bheith ar an inneall cuardaigh, ach gan iad a mhí-úsáid. Bíodh a fhios agat, áfach, go mbeidh aon duine a bhfuil seoladh cruinn an chomhaid áirithe sin ar eolas aige nó aici in ann rochtain a fháil air in aon chás.
Cad é an t-ordú ALLOW?
Sa chomhad is féidir leat eisceacht a chur leis an ordú CEAD. Tá an ghramadach comhionann, ach cruthóidh sé roinnt eisceachtaí don DISALLOW a ligfidh do imeall taiscéalaíochta suimiúla a oscailt don damhán alla.
Comhad samplach beag:
Gníomhaire úsáideora: Googlebot
Dícheadaigh: /images/
Ceadaigh: /images/holidays.jpg
Go bunúsach dúirt muid le Googlebot gan an fillteán íomhá a mheas, ach amháin i gcás grianghraf ar leith taobh istigh de, is é sin an ceann ó na laethanta saoire.
Agus sin, guys, an bhfuil sé. Scríobhamar ár gcéad chomhad robots.txt. Cinnte, d'fhéadfadh go mbeadh an méid atáimid ag dul a dhéanamh don suíomh iarbhír beagán difriúil, ach ní i bhfad níos mó. Má tá amhras ort, faigh comhairle ó stiúrthóir gréasáin speisialaithe i gcónaí. Molaimid duit iarracht a dhéanamh é a scríobh tú féin, ar an gcéad dul síos, agus é a sheoladh chuige le haghaidh seiceála, chun na rudaí a mháistir agus tuiscint níos fearr a fháil ar conas a oibríonn do shuíomh.
Cad é an comhghaol idir robots.txt agus sitemaps?
Is comhad é an mapa suímh a ghintear le forlíontáin speisialta ina bhfuil na naisc go léir ar an láithreán. Nuair a théann an damhán alla isteach sa suíomh, léann sé na róbait ar dtús, ansin déanann sé an suíomh a chraobhscaoileadh. Más rud é go bhfaighidh an róbat seoladh léarscáil an láithreáin le linn an crawl, beidh an próiseas iomlán i bhfad níos éasca.
Cuir iad seo a leanas leis an gcód thuas:
Léarscáil an láithreáin: http://www.ilnomedeltuositobellissimo.com/sitemap.xml
I gcrích
Tá gach comhad robots mar an gcéanna. Ciallaíonn sé seo go n-oibreoidh comhad Robots a scríobhadh do Google go breá freisin do Bing, agus leanann sé an ghramadach chéanna.
Ligeann comhad robots.txt dea-eagraithe duit shábháil am crawler. Ná bíodh dímholadh ort: seo é an chéad chéim i dtreo ratha!
B’fhéidir go mbeadh suim agat i:
Áiteamh nó ionramháil? Genesis agus tionchar stairiúil PR
Seo mar a leanann Caidreamh Poiblí, ó idirphlé sofaisticiúla na Gréige ársa go dtí an ré dhigiteach reatha, ag tairiscint nuálaíocht leanúnach
Daoine óga agus cryptocurrencies: conas tuilleadh a fháil amach faoi Bitcoin…
Is féidir le páistí a thabhairt isteach chuig airgeadraí digiteacha agus Blockchain a bheith ina iarracht spreagúil, i bhfianaise a cleamhnas le teicneolaíocht agus nuálaíocht
“An t-othar sa lár”: dóchas iontach agus cruinniú sa Seanad
Déanfaidh saineolaithe agus polaiteoirí an t-ábhar ar thábhacht na nuálaíochta i bhfeistí leighis do chúram sláinte na hEorpa a iniúchadh an 15 Bealtaine sa Róimh.
le Alberto NicoliniEagarthóir districtbiomedicale.it, BioMed News agus Radio Pico
Ceithre thír, aigéan ollmhór amháin: cás CMAR
Is é dorchla mara an Aigéin Chiúin thrópaiceach thoir: Panama, Eacuadór, an Cholóim agus Cósta Ríce comhaontaithe chun farraigí agus speicis mhuirí a chosaint...