Se lasciamo un faldone di carte in una stanza ben chiusa, lo ritroveremo tale e quale anche dopo un secolo. Un server acceso invece smetterà di funzionare dopo pochi anni

Il web che si perde

Eugenio Cau
La rete, una biblioteca borgesiana che dà l’illusione di essere infinita. In realtà è un fragile archivio: non tutto sarà ricordato per sempre. Internet sta cadendo a pezzi con una velocità che aumenta mano a mano che aumenta la quantità dei dati caricati online

Il primo comandamento di internet, da sempre, è la regola del tatuaggio: pensa bene prima di scrivere, è indelebile, se te ne penti non va via. Non pubblicare online ciò che tra dieci anni potrebbe imbarazzarti. Le foto da ubriaco alle feste con i colleghi di università è meglio non caricarle su Facebook se non vogliamo che dopo la laurea il datore di lavoro le usi per la valutazione dell’etica professionale, e i figli piccoli, che adesso sembrano tanto carini nelle foto spiattellate online su Instagram, tra quindici anni potrebbero non essere contenti che il loro album di infanzia sia stato di dominio pubblico. Una battuta comune è che internet ha la memoria lunga, e migliaia di politici sputtanati, di starlette dalla reputazione rovinata, di cittadini comuni a cui è scappato un tweet non politicamente corretto lo confermano: su internet gli errori non si cancellano, si può provare a nasconderli ma alla fine saltano fuori, e internet ha la memoria lunga ma non ha molta misericordia. Internet non perdona nemmeno gli errori dei giornalisti. Un tempo si poteva abbellire con fatti di colore non verificati una corrispondenza dall’estero sicuri che nessuno se ne sarebbe mai accorto, improvvisare una dichiarazione, dimenticarsi di verificare i nomi, convinti che la reputazione del giornale sarebbe stata sufficiente perché tutti considerassero un’informazione come vera. Oggi plotoni di fact checker improvvisati dragano le pagine internet dei giornali in cerca di errori e malafede, e la memoria di internet gioca contro i giornalisti: tutto ciò che è pubblicato rimane, i giornali possono provare a mettere offline un articolo sbagliato, ma la rete ne ha già fatto decine di copie, lo sputtanamento è inevitabile. E’ su questa idea di internet, del “finalmente la conoscenza a portata di tutti e per sempre”, che si è fondata per esempio la retorica del dilettantismo del Movimento 5 stelle, è questa l’impressione generale che tutti abbiamo della rete. E’ sbagliata.  Internet sta cadendo a pezzi nell’esatto momento in cui leggete queste righe, con una velocità che aumenta mano a mano che aumenta la quantità dei dati caricati online. Al contrario di quello che pensiamo, internet è incredibilmente fragile, e ciò che scriviamo online ha tanta possibilità di andare perduto quanto ciò che scriviamo su carta, se non maggiore.

 

La lunghezza della vita media di una pagina web, ha scritto di recente Adrienne Lafrance, giornalista che si occupa di tecnologia per l’Atlantic, era di 44 giorni nel 1997 e di 100 nel 2003. Una ricerca dell’Online Computer Library Center, la rete bibliotecaria più ampia del mondo, nel 2008 ha iniziato a tenere sotto controllo 2.700 risorse digitali, la maggior parte delle quali non avevano una versione stampata. Dopo un anno, l’8 per cento dei link a queste risorse aveva smesso di funzionare. Nel 2011, tre anni dopo, il 30 per cento delle risorse era svanito. Immaginiamo che oggi questa percentuale sia salita ancora. Internet si sgretola, e anche se le gigantesca quantità di dati caricati ogni secondo non ci consente di accorgercene, stiamo perdendo pezzi di quella che pensavamo fosse la nuova biblioteca di Alessandria. Lafrance cita un caso piuttosto emblematico, quello di The Crossing, una serie di reportage pubblicata online dal Rocky Mountain News di Denver, uno dei più antichi quotidiani americani. The Crossing racconta la storia di un tragico incidente stradale avvenuto in città nel 1961, ed è stato pubblicato a puntate sul sito del Rocky Mountain per oltre un mese nel corso del 2007. Il reportage aveva una stringata versione cartacea, ma su internet divenne un lavoro multimediale molto avanzato per la sua epoca, con moltissimo materiale originale che Kevin Vaughan, l’autore degli articoli, aveva impiegato oltre un anno a radunare. Il reportage multimediale di Vaughan fu finalista al premio Pulitzer di quell’anno, ma dopo pochi mesi il Rocky Mountain dichiarò fallimento. Nel giro di poco, i server su cui era ospitato The Crossing furono trascurati e il reportage iniziò a perdere pezzi. Quando poi i server furono spenti, The Crossing sparì. Era un’opera unica, usava dei formati proprietari, non ne erano state fatte copie online. Era anche un’opera di valore intellettuale, una testimonianza importante della vita della città di Denver. Ma era sparita, svanita nel nulla. La storia di The Crossing in realtà finisce bene. Vaughan aveva conservato gran parte del reportage su un dvd, e nel 2013 ha ottenuto l’autorizzazione per riportare tutto online, dopo un lungo lavoro di riconversione dei formati (una prova di più che non bisogna mai fidarsi del cloud computing). Ma se internet ha consentito che un reportage finalista al Pulitzer svanisse nel nulla per anni, cos’altro potrà sparire?

 

La fragilità di internet riguarda in parte tutto il mondo digitale, ed è l’obsolescenza dei supporti. Esattamente come è diventato difficile leggere il contenuto dei vecchi floppy disk, (tra qualche anno diventerà quasi impossibile), sta diventando sempre più difficile fruire dei contenuti creati in Flash, un sistema diventato obsoleto qualche anno fa, e le vecchie pagine internet, se non aggiornate, stanno man mano perdendo elementi, perché i browser non sono più in grado di leggerli. Ma al contrario degli archivi digitali, la fragilità di internet è strutturale. E’ stato pensato come un sistema di comunicazione, non come un archivio, e la sua stessa architettura è votata all’effimero.

 

“Internet è un ambito vulnerabile dal punto di vista della trasmissione della memoria storica, in questo campo siamo scoperti”, dice al Foglio Roberto delle Donne, professore di Storia medievale all’Università Federico II di Napoli che da anni si occupa di conservazione dei documenti digitali. “Il digitale richiede interventi di aggiornamento e migrazione continui per assicurarne la conservazione e la leggibilità, e questo è un problema ancora troppo sottovalutato. Le grandi agenzie nazionali preposte alla conservazione non se ne occupano adeguatamente, nonostante la presenza di alcuni programmi di livello internazionale. Allo stato attuale, per esempio, non abbiamo garanzie che il contenuto dei social network sia registrato e conservato secondo standard tecnici, legali e organizzativi adeguati”.

 

“La situazione è drammatica”, dice al Foglio Gianluca Braschi, professore di Archivistica digitale all’Università di Bologna (sede di Ravenna). “Anche progetti enormi come l’Internet Archive stanno diventando sempre più difficili da gestire”. L’Internet Archive è un progetto che si propone di salvare tutte le pagine internet del mondo, in varie versioni, per testimoniarne l’evoluzione. 445 miliardi di pagine internet sono state salvate fino a oggi, dice la home page del progetto, ma le difficoltà economiche e tecniche minano la sua completezza. Uno dei collaboratori del progetto ha detto di recente che cercare di salvare i siti caricati sul web è come “stare nelle sabbie mobili”: qualsiasi cosa uno faccia internet ti inghiotte.

 

[**Video_box_2**]Will Fenton ha raccontato di recente su Slate la storia del Sept. 11 Digital Archive, il grande archivio digitale che si propone di raccogliere in un unico posto tutto il materiale digitale in circolazione sull’11 settembre, a uso e consumo dei futuri storici. Serve una spiegazione, perché la parola archivio digitale può voler dire due cose: un archivio digitalizzato, con scansioni o trascrizioni di vecchio materiale, o un archivio il cui materiale è nato su supporto digitale. Il Sept. 11 Digital Archive è un archivio del secondo tipo, e quindi conserva quasi interamente materiale nato su internet: 150 mila elementi tra foto, articoli di giornale, testimonianze, registrazioni, perfino giochi online in cui si spara a Bin Laden. Il ragionamento dei suoi creatori è che non sappiamo di che materiale avranno bisogno gli storici tra cinquanta o cento anni per fare la storia di uno degli eventi che ha segnato questo secolo, e dunque è necessario conservare il più possibile, conservare tutto, perché il quadro deve essere ampio, perché più le fonti sono complete e maggiore sarà la possibilità di raccontare ai nostri figli una storia simile a quella che abbiamo vissuto. Ma il Sept. 11 Digital Archive, come tutto su internet, nonostante la dedizione dei suoi creatori rischia di sparire. L’archivio è nato grazie a un finanziamento consistente della Alfred P. Sloan Foundation, e poi è sopravvissuto grazie a fondi statali, che si sono ridotti fino a essere tagliati definitivamente nel 2014. Oggi l’archivio riceve abbastanza denaro per parte del mantenimento, ma senza investimenti ingenti rischia di scomparire. E’ un’altra delle fragilità intrinseche a internet: non esiste un metodo passivo per preservare le informazioni digitali. Tutti gli archivi, anche quelli tradizionali, hanno bisogno di manutenzione, ma possiamo essere ragionevolmente certi che se lasciamo un faldone di carte in una stanza ben chiusa lo ritroveremo tale e quale dopo cinquanta, cento o perfino duecento anni, topi e umidità permettendo. Se lasciamo un server acceso e ronzante in una stanza ben chiusa, avremo l’assoluta sicurezza che dopo pochi anni smetterà di funzionare, e che se anche per un qualche caso fortuito dovesse resistere, dopo vent’anni quasi nessuno sarà in grado di leggerne le informazioni che contiene. Un libro può essere incendiato e comunque sarà possibile salvarne qualche pagina. Un’informazione digitale quando è persa è persa per sempre. Se mantenere un archivio tradizionale significa in buona parte tenerlo lontano dalle fonti di pericolo, mantenere un archivio digitale è come trascrivere gli incunaboli e le cinquecentine ogni dieci anni. E’ un lavoro da amanuesi, perché la cultura che viene trasmessa deve essere scelta in maniera diversa e più esplicita rispetto a come si è fatto negli ultimi secoli.

 

Come sarà scritta tra cinquant’anni la storia dell’11 settembre, che nei libri di storia odierni occupa qualche paragrafo tra le ultime pagine? Come sarà scritta la storia degli attentati di Parigi del 13 novembre? La strage di Parigi è un buon esempio di come le informazioni su internet, e dunque buona parte del materiale che servirà agli storici nei prossimi decenni, stia sparendo sotto i nostri occhi. Le operazioni dello Stato islamico sono state preparate online, usando canali che ancora non sono stati identificati per certo. Le comunicazioni sono avvenute tutte online. La propaganda islamista che ha preparato gli attentati e quella che li ha seguiti, sui siti e sui social network, è online. Le rivendicazioni sono online, le testimonianze dei sopravvissuti, i primi report dei giornalisti, i tweet di allarme e di solidarietà, le dichiarazioni dei leader, i messaggi audio, i video amatoriali, quelli delle telecamere di sorveglianza. La storia di quei giorni a Parigi è tutta online, e sta già sparendo. I tweet di propaganda dei membri e dei fiancheggiatori dello Stato islamico, per esempio, essenziali per capire la crescita del fenomeno, sono cancellati da Twitter perché costituiscono incitamento all’odio, con l’aiuto del gruppo di hacker Anonymous che segnala alla società i profili da chiudere.

 

“Il problema di internet è che le fonti scompaiono, non solo perché sono cancellate, ma anche perché annegano nella quantità di materiale caricato tutti i giorni”, dice al Foglio Mariella Guercio, presidente dell’Associazione nazionale archivistica italiana. “Il direttore della Library of Congress americana, per esempio, aveva promesso nel 2010 che la Library avrebbe tenuto un archivio di tutti i tweet pubblicati. Ma il progetto non ha mai visto la luce, perché si è rivelato particolarmente complesso e costoso. Nonostante le molte iniziative meritorie, tutte le soluzioni trovate finora sono parziali o temporanee, quando non dei palliativi. E’ necessario stabilire dei parametri più solidi per la conservazione del digitale, e l’esistenza di un’istituzione di memoria con personale addestrato a gestire la conservazione dei patrimoni documentari rimane essenziale”.

 

La trasmissione della memoria storica comporta da sempre delle scelte. Il cosiddetto “scarto archivistico”, cioè la scelta dei materiali da conservare e di quelli da buttare, e dunque dimenticare, è una pratica che esiste da secoli, perché da sempre c’è una parte della memoria che non siamo in grado di trattenere. “Internet ha reso questa scelta molto più precoce”, aggiunge Mariella Guercio. Ci costringe a decidere subito cosa trasmettere ai posteri, perché le informazioni rischiano di perdersi per sempre prima che possiamo trovare il tempo di rifletterci sopra. Ma è proprio in questo senso che la fragilità di internet è la storia di un rimpianto anticipato. Internet è una biblioteca borgesiana che ci dà l’illusione di essere infinita. Ci mostra la possibilità di non dover fare più scelte su cosa scartare, che tutto sarà ricordato per sempre, che la storia si scriverà da sola. Ma poi ce la toglie da sotto gli occhi, costringendoci a fare i conti con la sua e la nostra fragilità.

Di più su questi argomenti:
  • Eugenio Cau
  • E’ nato a Bologna, si è laureato in Storia, fa parte della redazione del Foglio a Milano. Ha vissuto un periodo in Messico, dove ha deciso di fare il giornalista. E’ un ottimista tecnologico. Per il Foglio cura Silicio, una newsletter settimanale a tema tech, e il Foglio Innovazione, un inserto mensile in cui si parla di tecnologia e progresso. Ha una passione per la Cina e vorrebbe imparare il mandarino.