La facciata del tempio cristiano scientista che oggi ospita l'Internet Archive. Foto di Girl2k, licenza Creative commons

L'archivio della conoscenza 2.0

Eugenio Cau

L’Internet Archive, a San Francisco, preserva da vent’anni la cultura digitale e ha un obiettivo ambizioso, come la biblioteca di Alessandria: diventare un’arca di conoscenza

“The history of libraries is one of loss. The Library of Alexandria is best known for its disappearance” (Brewster Kahle)

 

       

Il quartier generale dell’Internet Archive, nel distretto di Richmond, a San Francisco, è un tempio sconsacrato della fede cristiano scientista. Un grande edificio neoclassico, tutto bianco, senza simboli religiosi come vuole la peculiare religione che l’ha fatto costruire, un culto risalente al Diciannovesimo secolo. Le scrivanie di chi lavora all’Internet Archive, dipendenti e volontari, piene di schermi e di ninnoli, con le sedie tutte diverse l’una dall’altra, sono al piano seminterrato, dove un tempo si teneva il catechismo della domenica. In uno degli uffici, cubicoli aperti che danno sul grande open space, c’è un manifesto che attira l’attenzione. E’ uno slogan della polizia americana, “If you see something, say something”, che sarebbe: se vedi qualcosa [di sospetto], segnalalo [alla polizia]. Ma la parola “say” è stata modificata in “save”, e lo slogan, nella versione dell’Internet Archive, diventa: se vedi qualcosa, salvalo.

   


Avete presente quelle serie tv di accumulatori seriali? L’Internet Archive è così, con il romanticismo al posto della patologia


     

Avete presente quei reality show televisivi in cui si mostrano le vite degli accumulatori seriali? Persone con condizioni patologiche che non riescono a buttare via niente, devono conservare tutto e si trovano la casa piena di oggetti tanto da non poter più camminare? Ecco, l’Internet Archive è la versione digitale di un accumulatore seriale, con l’idealismo romantico al posto della patologia.

   

Fondato nel 1996 da Brewster Kahle, imprenditore di successo che negli anni Ottanta ha contribuito a costruire alcune delle architetture fondamentali del Web e che successivamente ha fondato Alexa Internet, un sito di ranking di pagine online che è stato comprato da Amazon ed è la ragione del nome dell’assistente virtuale della casa di Seattle, l’Internet Archive è conosciuto principalmente per la Wayback Machine. La Wayback Machine è un sito che conserva le pagine internet nelle loro varie versioni, come se fossero fotografie: se volete sapere com’erano Google o il sito del Foglio nel 2009, basta fare una ricerca facile sulla Wayback Machine. La ragione principale per cui si dice che “internet ha la memoria lunga”, e che online tutto torna a galla e niente è occultabile per sempre, è proprio la Wayback Machine: anche se una pagina web viene cancellata, sulla Machine saranno disponibili le sue versioni già salvate. Per due decenni, questo strumento è stato essenziale per giornalisti, attivisti e per tutti gli utenti di internet, ed è stato l’artefice di molteplici scoop. Se il Blog delle Stelle cancella vecchi post imbarazzanti, la Wayback Machine li può recuperare.

    

La Wayback Machine archivia i siti internet, tutti quelli che può. Non riesce a farlo con ogni pagina, ci sono dei problemi tecnici (per esempio: i paywall dei giornali online) e nel flusso infinito dei social network è costretta a fare una scelta. Ma quel che trova, lo assimila con voracità: se vedi qualcosa, salvalo, mettilo da parte. Poi c’è l’archivio dei libri, quelli digitali e quelli digitalizzati, che vengono resi tali da decine di professionisti pagati in tutto il mondo con macchine costruite appositamente, che secondo chi lavora all’Archive sono migliori di quelle usate da Google. C’è un archivio di audiolibri. Ci sono i vecchi dischi 78 giri, anch’essi digitalizzati. I videogame vintage. I cd musicali, le cui immagini di copertina sono scannerizzate a risoluzioni pazzesche. I video amatoriali dei concerti rock. Microfilm. Musicassette. Videocassette. Filmati di qualunque genere. Spezzoni di telegiornali. Software storici di vario tipo. Lettere delle amministrazioni governative. Riviste. Mappe digitali. Più decine e centinaia di archivi donati o concessi da musei, università, enti governativi e non, privati cittadini, aziende, think tank, perfino la Nasa.

          


Il grande deposito della conoscenza mondiale è al tempo stesso resistente e fragilissimo: se manca l’elettricità, muore


     

A scorrere semplicemente la pagina di Wikipedia che elenca tutti i tesori dell’Internet Archive (o, meglio ancora, la home page dell’Archive stesso), sembra che non ci sia una razionalità nella bulimia da archiviazione. Invece c’è, solo che è onnicomprensiva: se qualcosa è digitale o quanto meno digitalizzabile e ha un valore culturale anche irrisorio, può stare nell’Internet Archive.

Il paragone più comune è quello della biblioteca di Alessandria, il luogo dell’antichità dove tutta la conoscenza dell’umanità era conservata. Esattamente come la biblioteca di Alessandria, l’Internet Archive vorrebbe tenere dentro di sé tutta la conoscenza disponibile, tutto ciò che è scrivibile dentro a un hard disk può e deve essere conservato. E’ un’idea romantica, irrealizzabile, che tenta di piegare l’ideale alla realtà. Questo romanticismo si nota in tanti piccoli particolari. Per esempio: l’Internet Archive ha donato una copia di se stesso alla versione moderna della biblioteca di Alessandria, in Egitto. Non è certamente facile mantenere dei server in un paese politicamente instabile, ma dentro all’Archive lo volevano fare a tutti i costi, per il valore simbolico. Sulla porta dell’ufficio di Brewster Kahle, che in realtà è l’ufficio della sua assistente, perché lui tiene per sé soltanto una poltrona, c’è un cartello con scritto: “The Librarian”, il bibliotecario, e la sua missione esplicita è magniloquente: “Consentire a chiunque di avere accesso alla conoscenza, per sempre e gratuitamente”, come ha scritto un paio d’anni fa in un post sul blog ufficiale del progetto.

Usare un tempio sconsacrato come quartier generale è un’altra scelta simbolica: la sede non è modernissima e colorata come quelle delle startup che brulicano in città, ma il logo dell’Internet Archive, fin dagli inizi, è la facciata stilizzata di un tempio classico. “Quando Brewster ha visto questo edificio, così somigliante al nostro logo, ha pensato che fosse perfetto”, ci dice Mark Graham, direttore della Wayback Machine, che ha accompagnato due giornalisti italiani in giro per gli uffici. Il simbolo genera l’edificio, l’idealismo piega la realtà.

Dal piano seminterrato, sede della scuola di catechismo domenicale, si sale nel grande salone del tempio. Prima di entrare, si incontra sul pianerottolo un ragazzone olandese che sta facendo scansioni della copertina di un cd musicale con brani di Bach. E’ sabato mattina, ma lui lavora ugualmente, fa scansioni a 1.200 ppi (significa: a risoluzione altissima, quelle copertine si potranno zoomare molto) perché Brewster ci tiene, anche se secondo me bastano 600 ppi, ci dice.

    

La grande sala del tempio è inondata di luce calda e piena di panchine di legno, come tutte le chiese, anche quelle dei cristiani scientisti: i nuovi inquilini dell’Internet Archive non hanno fatto quasi nessuna modifica rispetto al progetto originale. Al posto dell’altare c’è un palco, per presentazioni ed eventi. La prima cosa che si nota, tuttavia, sono decine di statue di figure umane alte circa un metro, sparse ai due lati del salone e in mezzo alle panchine. Ritraggono tutti i dipendenti che hanno lavorato all’Internet Archive per almeno tre anni, e ciascuna ha qualcosa di caratteristico in mano. Mark Graham indica ai giornalisti i personaggi più famosi, ci sono molti dei pionieri del Web, e questo non è un caso. L’Internet Archive è nato in un’epoca in cui la Rete era ancora un progetto idealistico. Un piano militare monopolizzato da un gruppo di nerd che immaginava di aver trovato il modo per diffondere la conoscenza in maniera universale. Google e Facebook, la sorveglianza, la targetizzazione, il controllo dei dati, le fabbriche dei troll sarebbero arrivati dopo, con il cinismo e il business. Agli inizi, internet era un posto pieno di gente romantica, e l’Internet Archive un po’ è ancora così. Tra le statue c’è anche Aaron Swartz, cofondatore di Reddit, che nel 2013 si uccise a 26 anni dopo essere stato condannato alla prigione per un’azione a favore della libertà di conoscenza. Lui in mano porta un laptop.

    


Fondato nel 1996 da uno dei pionieri di internet, l’archivio ha l’obiettivo esplicito di diventare la nuova biblioteca d’Alessandria


              

Sotto ai finestroni principali del tempio, decorati con arcate, ci sono due enormi armadi-server neri con luci che si illuminano a intermittenza, come due totem. Sono lì a scopo principalmente decorativo, i veri server sono nelle stanze laterali dietro al palco, e ronzano in maniera fastidiosa. Ammonticchiati in giro ci sono gli scatoloni con gli hard disk, che vengono sostituiti mano a mano, periodicamente. E’ lì che la conoscenza mondiale, la nuova biblioteca d’Alessandria, è conservata, almeno in doppia copia, e in molteplici luoghi.

    

La bulimia archivistica dell’Internet Archive è anzitutto un discorso di precauzioni. Ci sono precauzioni politiche: nel novembre del 2016, dopo le elezioni americane, Brewster Kahle decise di creare una copia di tutto l’archivio in Canada, temendo una restrizione delle libertà negli Stati Uniti sotto Donald Trump. Per ora le previsioni fosche non si sono avverate, ma il Canada non è l’unico paese in cui l’Archive conserva copie di riserva, e i nomi di alcuni di questi paesi sono riservati. Ci sono precauzioni legali: archiviare una quantità così enorme di materiale significa rischiare di incorrere in un crogiolo di differenti regolamentazioni statali riguardo a copyright, diritto d’autore, voleri di eventuali eredi. Anche in questo caso nell’Internet Archive c’è una dose di romanticismo: la missione compulsiva degli archivisti digitali è così importante che spesso decidono che molti rischi meritano di essere presi, anche se con ragionevolezza. Ci sono precauzioni tecniche: il principio di ogni buon archivio digitale risponde all’acronimo LOCKSS, “lots of copies keep stuff safe”: molte copie tengono la roba al sicuro. Le copie sono molteplici, gli hard disk sono sostituiti in continuazione, e questo costa milioni di dollari: l’anno scorso sono stati 17, i milioni.

         


   Ha consentito infiniti scoop: se il Blog delle stelle cancella una pagina imbarazzante, è probabile che sia salvato nell’Archive


   

Chiediamo alla nostra guida se ci sono precauzioni più apocalittiche. Uno dei principali problemi del trasferimento della conoscenza per via digitale è il fatto che i supporti sono molto deperibili. Significa: un libro di carta può durare facilmente qualche secolo. Un papiro o una pergamena, come quelli che erano conservati nella biblioteca d’Alessandria, possono durare perfino millenni, se conservati alle giuste condizioni e se non vengono dati alle fiamme. Un hard disk, se tutto va davvero bene, dura una decina d’anni. Probabilmente anche cinque. E dunque la nuova biblioteca d’Alessandria è più resistente di quella originale, perché è diffusa in ogni luogo e accessibile dappertutto – e al tempo stesso è più fragile, perché se manca l’elettricità si spegne anche lei, e senza manutenzione continua rischia di andare perduta dopo pochi anni. Mark Graham lancia una frecciatina: “Della biblioteca d’Alessandria non è rimasto niente, hanno avuto qualche problema di execution”, dice, con il gergo tipico della Silicon Valley quando si vuole indicare lo iato che c’è tra un’idea di business e i miliardi di dollari. Poi ammette: “Non pensiamo a questo problema tanto quanto vorremmo”, anche perché per ora è irrisolvibile: la conoscenza digitale può abitare solo su supporti deperibili.

    

Così, per ora, in quella grande non profit che è l’Internet Archive lavorano 160 persone (più molti volontari) che si lambiccano ogni giorno su come possono ampliare, migliorare, riorganizzare la loro collezione di conoscenza, e al tempo stesso cercano di lottare contro lo scorrere del tempo. Aggiornano e sostituiscono un hard disk dietro l’altro, pensando a nuovi modi per preservare sotto forma di big data tutta la sapienza del mondo.

 


  • Eugenio Cau
  • E’ nato a Bologna, si è laureato in Storia, fa parte della redazione del Foglio a Milano. Ha vissuto un periodo in Messico, dove ha deciso di fare il giornalista. E’ un ottimista tecnologico. Per il Foglio cura Silicio, una newsletter settimanale a tema tech, e il Foglio Innovazione, un inserto mensile in cui si parla di tecnologia e progresso. Ha una passione per la Cina e vorrebbe imparare il mandarino.