Un recente piccolo incidente occorso a Google News ci permette di fare una riflessione in generale su come funziona questo servizio e soprattutto perché ogni tanto sembra fare i capricci.
In questo caso specifico, l’allarme era esploso alla fine di giugno quando vari gestori di siti web che utilizzano Google News come cassa di risonanza si sono accorti che una serie di pagine non venivano indicizzate correttamente e quindi non apparivano portando, conseguenza che si può facilmente immaginare, ad una riduzione sostanziale del traffico.
Il team responsabile di Google News si è mosso nel più breve tempo possibile cercando di trovare una soluzione a questa anomalia diffusa. Una anomalia che, stando agli ultimi update del Google Search Status Dashboard nella sezione incidenti, è ora risolto. La soluzione è stata un fix rilasciato il 14 luglio scorso. E questo significa che forse, anche per il tuo sito, potresti aver notato problemi di traffico. Ma, a prescindere dalla anomalia momentanea, può effettivamente capitare che una o più pagine di un sito web siano scoperte da Google ma non indicizzate. Quali sono le cause? E soprattutto come si risolve?
Perché Google News e gli altri servizi non indicizzano il tuo sito WordPress
La grande rete in cui è possibile navigare e trovare quasi qualunque cosa funziona un po’ come una gigantesca cartina di una unica immensa città virtuale in cui ognuno vive in un luogo preciso. Se però una zona di questa città, e quindi le pagine di un sito, non vengono indicizzate, quella zona risulta un po’ come quelle aree non accessibili nei videogiochi che sono lì solo per fare colore ma che non portano avanti la storia in alcun modo.
Vicoli che si possono guardare solo da lontano e che quindi non hanno una reale funzione. A differenza dei videogiochi, però, quando crei il tuo sito WordPress non vuoi che ci siano pagine che non sono esplorabili dagli utenti e quindi è necessario che tutti i tuoi contenuti, oltre ad essere scoperti dal servizio di Google, siano anche indicizzati nella maniera corretta. Per fare ciò la grande G porta avanti periodicamente quella che viene definita operazione di crawling, un esame di tutto ciò che c’è in rete per creare le mappe di tutti i nuovi luoghi notevoli digitali.
Ma, se andando a guardare il Page Indexing Report dentro la Search Console ti rendi conto che alcune pagine hanno l’etichetta discovered currently not indexed c’è qualcosa che non va. Come spiegato nella documentazione ufficiale di Google, se l’operazione di crawling non va a buon fine succede di solito perché Google ha tentato di analizzare una URL ma l’operazione avrebbe portato a un sovraccarico. Ma che cosa porta il bot di Google a non finalizzare l’operazione di crawling?
A rispondere John Mueller che ha fornito, attraverso Twitter, due spunti su cui riflettere. Da una parte Mueller sottolinea che è bene analizzare la capacità del server. Perché, e lo ricorda sempre Mueller, non esistono solo i bot di Google che fanno indicizzazione dei siti web ma anche quelli di Apple per esempio e quelli di Microsoft. Il che significa che c’è effettivamente rischio di un traffico eccessivo che può portare a problemi. Se hai delle pagine che non sono state indicizzate controlla quindi che il tuo server sia all’altezza della struttura che hai dato al tuo sito WordPress.
L’altro aspetto da controllare, secondo Mueller, è la qualità complessiva del sito. Che non significa semplicemente la qualità dei contenuti che metti ma anche la qualità generale di tutto il sito web perché, se ci sono vaste porzioni di un sito che agli occhi di Google risultano di scarsa qualità, semplicemente i bot possono decidere che non vale la pena procedere alla indicizzazione.