Ma+abbiamo+davvero+bisogno+del+file+robots.txt%3F+La+risposta+di+Google
soswpit
/consigli-wordpress/file-robots-txt-posizione/amp/
Consigli WordPress

Ma abbiamo davvero bisogno del file robots.txt? La risposta di Google

Published by
Valeria Poropat

Tra le piccole grandi croci e delizie di chi si occupa di siti web c’è il file robots.txt. Qualcosa che, regola vuole, ogni sito deve possedere e deve strutturare in un modo molto preciso.

Questo perché il file robots.txt è un elemento imprescindibile del modo in cui poi il sito parla con i bot che si occupano di esaminare e indicizzare i contenuti. Tempo fa avevamo già visto, per esempio, quello che Mister Google in persona pensava di questi file e di come si dovesse gestire la loro presenza.

Adesso, da parte di Gary Illyes arriva una idea che può sembrare rivoluzionaria se non addirittura eretica. Ma data la fonte ovviamente è invece estremamente sensata e logica. La questione che Illyes affronta, in un post pubblicato sul suo account LinkedIn, è dove va messo il file robots.txt. Quello che ci hanno insegnato potrebbe non essere del tutto corretto.

Il robottino dove lo metto? La questione della posizione del file robots.txt

La grande rivoluzione che in poche righe Illyes sembra voler avviare è che non necessariamente il file robots.txt deve trovarsi nel root domain del sito per il quale è stato progettato. Qualcosa che, come accennavamo, contrasta invece con tutto ciò che finora ci avevano insegnato sulla gestione di questo piccolo grande file.

Illyes prosegue nel suo post facendo l’esempio di un sito che ha un sito principale e un CDN, un Content Delivery Network. Logica vorrebbe, o così pensiamo tutti, che debba esserci un file robots.txt nel root domain del sito principale e un altro nel root domain del CDN.

A quanto pare non è così.

In queste situazioni, spiega Illyes, è possibile reindirizzare i bot perché vadano a guardare solo il file robots.txt che si trova nel CDN senza dover per forza quindi gestire due file robots.txt contemporaneamente. Si tratta di una soluzione che riduce parte del carico di lavoro di chi gestisce i siti web e che sfrutta il protocollo RFC9303 per i crawler.

L’occasione per parlare della posizione del file robots.txt sono i trent’anni della sua creazione. E infatti Illyes in realtà ha pubblicato altri interventi molto interessanti che vanno a guardare a questi file da prospettive nuove e diverse. Vediamo che cos’altro possiamo imparare dai suoi post. Ma prima un intervento di John Mueller:

Ti sei mai chiesto perché c’è spazio per i commenti?

La struttura dei file robots.txt è fatta in modo tale che, e questo è il presupposto di un altro post pubblicato sempre da Illyes su LinkedIn, non c’è possibilità che i crawler commettano errori. Nel senso che i parser ignorano la maggior parte dei piccoli errori e delle sviste che nella compilazione da parte dell’essere umano possono accadere.

Illyes fa l’esempio di ciò che succede se non si scrive correttamente disallow: niente. Così come non succede niente se non si rimuove il disegno ASCI (e perchè lo si dovrebbe togliere poi?). Diligentemente, quindi, i parser lavorano anche se l’utente umano non è stato particolarmente bravo.

E allora, questa è la domanda che si pone Illyes, che ci facciamo con gli spazi dedicati ai commenti? Lasciando aperta la domanda agi altri utenti della piattaforma, le risposte che si sono ammonticchiati sono nuovi punti di vista che vale la pena leggere. C’è per esempio chi accomuna gli spazi dei commenti alle regole html, che però non servono più, almeno in parte, perché i browser sono stati addestrati a soprassedere.

Quando i file robots.txt sono stati concepiti per la prima volta doveva esserci uno spazio per i commenti, semplicemente perché nessuno immaginava che i parser sarebbero diventati abbastanza intelligenti da ignorarci e non far saltare per aria un intero sito web.

E tra i commenti non poteva non esserci anche quello di John Muller che poi sul suo sito personale ha creato un post in cui ha raccolto alcuni dei commenti più assurdi rintracciati all’interno di questi file. Un’altra lettura che merita di essere fatta.

Valeria Poropat

Laureata in traduzione, Valeria adora da sempre la tecnologia in ogni sua forma e in particolare ai modi in cui la tecnologia può aiutare ad avvicinare le persone e stimolare la curiosità.

Recent Posts

Quando una parola nel titolo può cambiare il destino di un articolo

Nella stesura di un articolo, il titolo gioca un ruolo cruciale. Ogni parola contribuisce a…

9 ore ago

Come cambia il comportamento degli utenti quando un sito usa colori freddi

Sono diversi i cambiamenti che avvengono quando un sito adotta palette fredde. I colori freddi…

20 ore ago

Il paradosso del traffico: perché alcuni articoli performano mesi dopo la pubblicazione

Ci sono volte in cui i contenuti performano meglio mesi dopo la loro uscita. I…

1 giorno ago

Gli utenti leggono più volentieri contenuti con numeri dispari: leggenda o verità?

I contenuti con numeri dispari sembrano più efficaci dei numeri pari, ma è vero che…

2 giorni ago

La verità sulle homepage minimal: perché a volte funzionano meglio di siti super-complessi

Optare per un design minimal porta diversi vantaggi come una maggiore leggibilità e una migliore…

2 giorni ago

Cosa succede se blocchi l’accesso al tuo sito con il blocco geografico?

Non si dovrebbe mai bloccare il traffico verso il tuo sito web, ma in alcuni…

3 giorni ago