Addio+al+38%25+delle+pagine+web
soswpit
/news/addio-38-pagine-web-contenuti-eliminati/amp/
News

Addio al 38% delle pagine web

Published by
Valeria Poropat

Per evitare di pubblicare e poi pentirsene è sempre bene riflettere sul fatto che quello che finisce in rete in rete ci rimane.

E dovrebbe bastare il timore di essere rintracciati a distanza di decenni perché si è scritta o pubblicata una baggianata a tenerci lontani dal tasto Pubblica. Una buona regola che evita anche tante volte di cadere anche vittima di truffe.

Ma c’è il rovescio della medaglia. Perché in un mondo che non esiste costruito in base ad una serie caotica di impulsi elettrici e radio che viaggiano saltando da un ripetitore all’altro, occorre anche guardare alla conservazione delle informazioni.

Secondo uno studio pubblicato dal Pew Research Center, infatti, c’è un abbondante 38% di pagine web nate 10 anni fa e che ora non sono più accessibili. E a giudicare dalle discussioni che si sono aperte online a seguito dei risultati di questa ricerca non è solo una questione di siti web ma di contenuti in generale.

Pagine web che non si trovano più dove sarebbero dovute essere

Siamo sempre tutti lanciati verso il futuro, perché l’algoritmo apprezza che vengano pubblicati nuovi contenuti. Contenuti freschi. A ripetizione. Prodotti con la stessa velocità con cui vengono consumati in modo tale da tenere gli utenti il più a lungo possibile incollati agli schermi di preferenza.

Ma in questa corsa, tanto materiale dopo un po’ entra nello specchietto retrovisore e poi sparisce. Di solito sparisce e riaffiora se qualcuno fa una ricerca precisa ma altre volte, e a quanto pare per alcune annate più di altre, sparire significa sparire. Non semplicemente essere dimenticati alla decima pagina dei risultati della SERP.

Essere cancellati e non essere più leggibili o rintracciabili. Informazioni che quindi prima c’erano e ora non ci sono più. Il cosiddetto fenomeno del link rot, ovvero del decadimento dei link, è al centro di questo studio pubblicato da Pew Research Center. La ricerca si è concentrata sui contenuti pubblicati tra il 2013 e il 2023, cercando di scoprire quanti non sono più disponibili.

Il grafico che accompagna il report di Pew Research Center – sos-wp.it

Il grafico mostra come, tranne una strana anomalia per il 2017, ci sia una curva crescente che dal 2023, con un 8% di pagine web, sale fino al 38% per i siti con pagine pubblicate nel 2023. Le annate che da questo punto di vista risultano più problematiche sono il 2014, 35%, e poi il 2019, 32%, seguiti però da vicino dal 2015, 31% a pari merito con il 2018, e con il 2016, con il 30% delle pagine scomparse. Sotto il 30% ci sono le annate dal 2020 in poi e stranamente nel 2017.

In particolare lo studio si è concentrato sui siti istituzionali, sulle pagine di Wikipedia tra i riferimenti che ogni contenuto deve avere e poi i siti di news. E proprio su Wikipedia oltre la metà delle pagine contiene almeno un link a una risorsa che non è più consultabile. Quando una risorsa diventa non più consultabile significa che non è più possibile il contraddittorio su quelle informazioni. Non sono informazioni che si possono aggiornare e non si possono confutare.

E, un altro aspetto su cui si è concentrato lo studio, questo problema non riguarda soltanto le pagine web propriamente dette ma anche i social. Ma per i social, la riflessione che si può fare dai dati è leggermente diversa.

Come è stato condotto lo studio

Essendo uno studio ufficiale, ovviamente è stata identificata la metodologia con cui per prima cosa sono state classificate le pagine web non accessibili. Nella sezione apposita si sottolinea che non si tratta di pagine che per esempio non hanno sistemi per permettere ai non vedenti di fruire dei contenuti ma proprio di pagine che “non esistono più sul loro server host oppure non esiste più il server host stesso“.

Si tratta quindi di quelle pagine che se si incontrano sono sostituite dalla famosa pagina 404. Altre pagine che non esistono più sono quelle che sono state cambiate “a volte in maniera sostanziale rispetto a quelle che erano originalmente“. Per trovarle sono state esaminate circa un milione di pagine web prese a caso dagli archivi di Common Crawl.

In totale è emerso che un quarto di tutte le pagine raccolte nel decennio preso in esame, 2013-2023, non erano più accessibili alla data di ottobre 2023. Di questo 25% il 16% erano pagine che erano state cancellate manualmente mentre il 9% è risultata inaccessibile perché il dominio non esisteva più. Nel confronto tra siti istituzionali e siti di news alcune percentuali risultano pressoché sovrapponibili.

Il 23% delle pagine esaminate sui siti di notizie contenevano almeno un link che rimandava ad un errore, per i siti istituzionali si parla del 21%. Tra tutti i link esaminati il 6% nei siti istituzionali non è funzionante mentre non è funzionante il 5% dei link esaminati sui siti di notizie. E per i siti di notizie non c’è distinzione tra quelli molto famosi e quelli molto di nicchia: i siti di news a più alto traffico hanno il 25% di pagine con almeno un link che non funziona più mentre quelli meno conosciuti salgono appena al 26%.

Il numero più allarmante è quello di Wikipedia, dove l’82% del campione di 50.000 pagine in lingua inglese esaminate contiene almeno un link che rimanda a una risorsa che non è più consultabile.

Perché è bene parlare di queste pagine web

Abbiamo visto alcuni dei numeri emersi dallo studio di Pew Research Center e di per sé possono essere visti in molti modi. La riflessione che però vogliamo fare in questa occasione riguarda l’importanza del renderci conto che, mentre la nostra vita si smaterializza e finisce nel web, così può anche scomparire.

Avere tutto nel cloud, a portata di mano, permette di accedere rapidamente a ciò che serve ma, allo stesso modo e con la stessa facilità, un account può andare perduto, un sito può essere hackerato e cancellato dalla faccia della terra, le informazioni possono essere distorte o eliminate. Quando si parla di internet e di rete si pensa solo al domani ma ogni tanto sarebbe bene voltarsi per valutare se quello che ci siamo lasciati dietro è degno di rimanere o se forse non era il caso di non pubblicarlo mai.

E se è degno di rimanere occorre necessariamente fare in modo che ci siano sistemi di conservazione che impediscano, o limitino, la cancellazione delle pagine web del passato. La nostra storia è cominciata sulla pietra e ora viaggio nel vento. Se non troviamo il modo di riportare qualcosa sulla pietra finiremo col perdere tutto.

Siti scomparsi e nessun riferimento. Non è solo questione di errore 404 – sos-wp.it

Per i social il discorso è diverso

Le informazioni che viaggiano online possono essere più o meno importanti e quelle importanti vanno conservate. Ma l’altra parte dello studio di Pew Research Center si è concentrato su un altro tipo di informazione apparsa e scomparsa rapidamente: i messaggi social e nello specifico i messaggi sul social che una volta chiamavamo Twitter.

Anche nel caso di quello che ora si chiama X, c’è un 18% di messaggi che non sono più disponibili tra quelli pubblicati nella stessa decade scelta per i siti tradizionali. E anche in questo caso i motivi per cui i messaggi spariscono sono diversi. Alcuni, come spiegato sul paper, spariscono perché vengono effettivamente eliminati.

In altri casi spariscono perché l’account che li ha pubblicati sparisce, oppure viene sospeso o ancora diventa un account privato. Trattandosi di un social, l’idea che qualche messaggio possa non essere più disponibile può farci alzare le spalle. Del resto proprio i social hanno sdoganato la libertà di parola globale creando spesso situazioni in cui chi dovrebbe tacere invece è il primo ad alzare la voce.

Ma dall’analisi fatta da Pew Research Center emerge invece un pattern che può essere visto come un campanello d’allarme da non sottovalutare. Perché se può non essere interessante che di questo 18% di messaggi X che non sono più disponibili più della metà erano in lingua turca seguiti da quelli in lingua araba e poi quelli in lingua inglese, altre caratteristiche lo sono di più e mostrano come i social possono diventare terreno fertile per le più raffinate forme di malainformazione del pianeta.

Un’altra caratteristica in comune di molti messaggi pubblicati è poi scomparsi insieme ai loro account è che si tratta, per esempio, di account che non hanno una qualche sorta di personalizzazione nel profilo utente.

Quando si decide di aprire un profilo su un social la prima cosa che si viene sospinti a fare è pubblicare una propria foto, con in più qualche informazione biografica. E invece molti messaggi sono apparsi e scomparsi su account con nessuna personalizzazione nella immagine del profilo né nel campo destinato alla bio e, in più, la stragrande maggioranza erano account non verificati.

Per i messaggi social sulla piattaforma che appartiene ad Elon Musk, Pew Research Center ha anche portato avanti un test per vedere la capacità di sopravvivenza dei messaggi, scoprendo che circa il 15% è scomparso dopo un mese dalla pubblicazione, il 10% entro una settimana, il 3% entro un giorno dalla pubblicazione e c’è un 1% che sparisce nel giro di un’ora.

La metà sparisce dopo circa sei giorni. Date le informazioni riguardo il modo in cui gli account spariscono e il modo in cui i messaggi spariscono non possiamo certo pensare che siano solo frutto di lacrime di coccodrillo o ripensamenti. Perché sui social rispetto ai siti tradizionali è molto più facile pubblicare qualcosa e poi scomparire.

L’importante, se quello è lo scopo, è averlo pubblicato e innescare una reazione. Un motivo di più per eseguire a monte, in qualità di utenti della rete, un’analisi dettagliata di quelle che sono le fonti con cui ci si informa, riflettere prima di scrivere e di rispondere e magari conservare una copia fisica di ciò che è realmente importante.

Valeria Poropat

Laureata in traduzione, Valeria adora da sempre la tecnologia in ogni sua forma e in particolare ai modi in cui la tecnologia può aiutare ad avvicinare le persone e stimolare la curiosità.

Recent Posts

Curiosità su WordPress: statistiche e fatti interessanti del 2024

WordPress copre più del 40% di tutti i siti che si trovano al momento pubblicati…

2 giorni ago

Ahrefs Evolve 2024: L’evento a Singapore con 500 esperti mondiali

Quando si parla di marketing e di Digital marketing si parla di persone. Ma quando…

3 giorni ago

Come fa Google a misurare la qualità? Ce lo spiega la direttrice delle ricerche in persona

Costruire contenuti di qualità che rispondano ai bisogni degli utenti che fanno ricerche su Google.…

3 giorni ago

Google Ads si aggiorna: novità nelle corrispondenze delle query

Anche Google Ads si sta aggiornando e la società della grande G ha inserito alcune…

5 giorni ago

Un tema WordPress per i progetti governativi: ecco cosa ha fatto WordPress VIP

WordPress VIP è una soluzione di hosting e gestione completa che viene spesso utilizzata dalle…

6 giorni ago

Vulnerabilità pesanti nel mese di giugno: ecco cosa devi aggiornare all’istante

Anche per questo mese di giugno abbiamo deciso di esaminare quelle che sono le vulnerabilità…

7 giorni ago