cerca

News revolution

Viaggio al centro della filosofia giornalistica di Nate Silver, la volpe che vuole conoscere il mondo “così com’è” con la forza dei numeri.

5 Aprile 2014 alle 17:49

Nate Silver ha mandato a gambe all’aria il vecchio mondo dell’informazione esercitandosi duramente con la psefologia, modellizzando, rimestando algoritmi fino a diventare maestro di quell’arte ambigua, e per certi versi occulta, che gli iniziati chiamano “data journalism”. Ha traghettato i numeri dalla sponda dello specialismo a quella del generalismo, ha contribuito allo sdoganamento del nerd, all’elevazione del secchione a autorità indiscussa e indiscutibile, persino cool nella sua multiforme identità di profeta e demistificatore, indovino che legge il futuro non nelle interiora degli animali ma nel flusso imperscrutabile dei “big data”. La tribù giornalistica di cui Silver fa parte è ampia e variegata, ci sono corsi universitari e dipartimenti dedicati all’area di intersezione fra la statistica, la scienza computazionale e il giornalismo, e molti di questi rivoluzionari millenial versati per la matematica che hanno dato una vigorosa spolverata all’industria agendo sovversivamente all’interno delle venerate istituzioni giornalistiche ora tendono a mettersi in proprio, magari sotto il cappello di un grande brand che concede assoluta libertà.

Il wunderkind Ezra Klein non è riuscito a convincere nemmeno il nuovo proprietario del Washington Post, Jeff Bezos – uno che non è noto per la diffidenza verso i linguaggi digitali e le innovazioni – a fare un investimento serio sul suo Wonkblog, il blog dei secchioni, autorevolissimo luogo giornalistico dove tutto, dall’Obamacare al matrimonio gay, viene spiegato con la forza inoppugnabile dei numeri. Klein ha trovato casa presso Vox Media, compagnia di nativi digitali in espansione. Silver, che in tempi elettorali era la locomotiva del traffico web del New York Times con il suo leggendario blog di sondaggi elettorali FiveThirtyEight, è stato sostanzialmente scaricato dalla Gray Lady e si è accasato sotto le insegne sportive di Espn. Alcune settimane fa ha lanciato una piattaforma in cui farà tutto quello che ha fatto finora, ma con più libertà e risorse. Aveva iniziato, com’è noto, sviluppando un modello per prevedere le performance dei giocatori di baseball, il più indicizzabile e statistico fra gli sport americani, applicando poi l’universale linguaggio dei dati, com’è arcinoto, alle previsioni elettorali, finendo per azzeccare quasi tutto nella tornata del 2008 e tutto in quella del 2012. Per “tutto” s’intende che Silver ha previsto l’assegnazione elettorale di tutti e cinquanta gli stati americani, pronosticando esattamente il numero magico di grandi elettori che Barack Obama avrebbe conquistato per riconfermarsi alla Casa Bianca. Non ha soltanto previsto la rielezione del presidente, per quello non servivano poi tanti algoritmi, ma ha previsto l’andamento di ogni singolo stato, compresi i nove “swing states” dove si gioca davvero la partita elettorale.

I blasonati istituti di sondaggi che da oltre un secolo studiano i trend elettorali sono usciti parecchio malconci dal confronto con un “outsider”, così si definisce, di 34 anni che è stato scrutatore compulsivo di almanacchi sportivi, contabile alla Kpmg, giocatore di poker online e molte altre cose. Il passaggio dalla casa base alla Casa Bianca ha dato immenso lustro al titolare della sezione FiveThirtyEight e tanti, tantissimi clic al New York Times, che in periodo di elezioni ha aumentato del 20 per cento il numero di visitatori unici sul sito; ne è seguita una fase di flessione fisiologica che Silver ha scaltramente usato per pubblicare “Il segnale e il rumore” (edito in Italia da Fandango), libro “che parla di come impariamo, un passo alla volta, ad arrivare alla conoscenza del mondo così com’è”.

E’ forse qui che le cose sono radicalmente cambiate per Silver, e il suo “data journalism” ha assunto le ambiziose fattezze di un impianto filosofico, orientato alla conoscenza del mondo così com’è. L’idea di Silver, fino a quel momento, era stata quella di fare in modo più sofisticato e affidabile quello che i giornalisti fanno da sempre in solido con gli statistici e i sondaggisti: compulsare dati, interpretare statistiche, individuare tendenze nascoste nei numeri, generalizzare osservazioni particolari, scorgere fenomeni nelle nebbie dei grafici. A un certo punto l’antifona è cambiata e il metodo di Silver è assurto al rango di paradigma epistemologico e visione del mondo. Una visione del mondo programmaticamente priva di visione. Nel manifesto pubblicato al lancio di FiveThirtyEight, Silver riprende l’antica distinzione di Archiloco fra la volpe e il riccio, traghettata nella modernità da Isaiah Berlin, filosofo che quasi per celia classificò “zoologicamente” i maggiori pensatori della modernità. Da una parte i ricci monisti, che fanno discendere tutte le osservazioni da un solo principio o idea; dall’altra le volpi pluraliste, che scrutano la realtà senza una precisa lente filosofica. A parte il fatto che Archiloco, nel suo famoso verso, parteggiava chiaramente per il riccio, Silver si propone come modello di volpe di ultima generazione. Ogni ipotesi interpretativa a priori va rigettata (a priori). Qualunque weltanschaaung è nemica giurata della “conoscenza del mondo così com’è”. Schemi gnoseologici e principi di verificazione sono vizi, distrazioni, “bias” che conducono all’errore. La volpe dev’essere libera di correre e saltare da una parte all’altra per poter dispiegare la sua potenza conoscitiva, per poter distinguere il “segnale” (verità) dal rumore di fondo (finzione). I modelli scientifici possono essere utili, ma sono “tutti sbagliati”, come diceva lo statistico George Box. E quando, nel mezzo di un’escursione nel sottobosco, la volpe incontra i “big data” ecco che il destino dei pluralisti si compie.

“In nessun modo – scrive Silver – pensiamo che tutto possa essere ricondotto a una formula o a un’equazione. Al contrario, uno dei nostri compiti sarà quello di criticare l’incauto uso delle statistiche quando compaiono nelle notizie. Altre volte, esploreremo nuovi modi perché i consumatori possano usare i dati a loro vantaggio e giocare ad armi pari contro governi e corporations”.
Nel mondo “così com’è” di Silver non ci sono modelli e ipotesi, ma soltanto procedure per compiere l’unica reazione alchemica dotata di senso: “Trasformare l’aneddoto in dati e informazioni”. L’aneddoto, inteso come proposizione senza contesto, quindi priva di valore veritativo, è la materia grezza che il “data journalist” modella come un demiurgo, seguendo rigorosamente una procedura in quattro fasi: raccolta, organizzazione, spiegazione, generalizzazione. L’endorsement di un politico a un tale candidato alle elezioni non dice nulla sull’esito della corsa, ma la somma di tutti gli endorsement a tutti i candidati può aiutare a prevedere chi vincerà. Si tratta soltanto di separare il segnale dal rumore con la giusta procedura.

A monte di tutto questo c’è un assioma che nel 2008 l’allora direttore di Wired, Chris Anderson, ha snocciolato in un articolo fondamentale per spiegare la portata di questo tentativo di rifondare l’intero impianto scientifico: “Con abbastanza dati, i numeri parlano da sé”. Per la scienza moderna il dato reclama sempre una teoria, abbisogna di un modello per essere significativo, per ambire all’universalità della legge occorre un’ipotesi d’indagine, altrimenti ci si balocca, al più, con un informe pasticcio di informazioni senza orientamento, dunque senza effettivo potere conoscitivo, esposto alla manipolazione degli ideologici ricci. Ma i “big data” funzionano diversamente, dice Anderson, interpretando un sentire comune nella comunità tecnologica. I “big data” sono qualitativamente diversi dagli antichi dati della scienza moderna, non sono il risultato di un’enorme addizione di elementi informativi di vecchia generazione. La loro “ampiezza”, per dir così, conferisce un certo grado di organizzazione intrinseco che rende superflue, e persino dannose, le ipotesi interpretative di contorno.

Il piede di porco dei “big data” apre la saracinesca di un nuovo paradigma scientifico in cui tutte le teorie sono messe fuori gioco. L’unica teoria che resiste è l’assenza di teorie.
In un recente articolo apparso sul Financial Times, Tim Harford ha ricordato un esempio illuminante in questo senso. Cinque anni fa un gruppo di ricercatori di Google ha pubblicato sulla rivista Nature i clamorosi risultati di un tentativo di tracciare la diffusione di un’epidemia di influenza negli Stati Uniti.

Laddove anche i database e le metodologie raffinate in decenni dal centro per la prevenzione delle malattie del governo americano avevano fallito, Google aveva avuto successo, riuscendo a seguire il diffondersi della malattia quasi in tempo reale. Il punto, in questo contesto, è che la procedura di Google era completamente priva di teoria. I tecnici che l’hanno elaborata non avevano alcuna conoscenza medica né nozioni specifiche circa la diffusione delle malattie. Non hanno consultato un singolo referto medico. Avevano però una enorme quantità di dati tratti dalle  ricerche su Google.
Incrociando tutti gli utenti che chiedevano al motore di ricerca informazioni legate all’influenza, ai suoi sintomi, ai farmaci indicati per curarla e alle farmacie vicine a casa dove acquistarli, i tecnici di Mountain View hanno creato una fedele mappa in real time della diffusione dell’influenza. Il progetto “Google Flu Trends” dimostrava contemporaneamente l’abilità tecnologica dei suoi creatori e – soprattutto – l’inutilità delle teorie specifiche intorno a un tema dato, in questo caso l’influenza. La quantità di dati (meglio: la loro qualità “big”) a disposizione di Google ha compensato l’assenza di una teoria specifica: una grandiosa vittoria della volpe.

E’ in virtù di questa tendenza verso il modello “theory-free” che Silver e gli arguti volpacchiotti del suo team possono occuparsi con autorevolezza di elezioni, home run, matrimoni gay, crediti d’imposta, Obamacare, crimine nelle periferie di Chicago e di qualunque altro fenomeno osservabile anche senza conoscere contenuti e metodi propri dei vari ambiti. Semplicemente perché contenuti e metodi propri non esistono più, sono superati da una über-teoria finalmente libera da tutte le teorie. Problema: quattro anni dopo la pubblicazione su Nature, la stessa rivista ha constatato che dopo diversi inverni di mappature perfette delle epidemie influenzali, “Google Flu Trends” aveva fallito. I tecnici riuscivano a riconoscere pattern di ricerca attorno alla tematica dell’influenza, ma non erano più in grado di ricavare da questi l’effettiva diffusione della malattia. Cos’era successo? Per qualche ragione avevano smarrito lungo la via la distinzione fra la correlazione e la causalità. Potevano tracciare correttamente tutti gli utenti che digitavano su Google certe parole chiave, ma questo non significava che gli utenti in questione fossero effettivamente ammalati; ma le ricerche dei non ammalati, si potrebbe obiettare, tendono a non essere numericamente rilevanti rispetto alle ricerche di chi effettivamente vuole sapere gli orari d’apertura della farmacia più vicina perché ha l’influenza (sono rumori, non segnali, nel linguaggio silveriano). Eppure “Google Flu Trends” aveva perso la bussola, non riusciva più a seguire l’epidemia. L’esempio non dimostra che le volpi di Google sistematicamente sbagliano, ma che la prima e più illustre vittima della scienza dei “big data” è il nesso di causalità. Galileo e gli scienziati moderni avevano dato una grandiosa rasoiata alla causalità aristotelicamente intesa; Google e le volpi postmoderne si propongono di dare una grandiosa rasoiata alla causalità modernisticamente intesa. Quando si ha a che fare con i “big data” la correlazione diventa in qualche modo un nesso sufficiente per conoscere il mondo “così com’è”. Viktor Mayer-Schönberger e Kenneth Cukier, grandi teorici dei “big data”, lo dicono con chiarezza: “La causalità non va scartata, ma è stata buttata giù dal suo piedistallo di fonte primaria di significato”. Il riccio, rintanato nel suo ottuso monismo, ha le ore contate.

Torniamo a Silver e al “data journalism”. L’altro lato dell’ambizione alla conoscenza del mondo così com’è è, ovviamente, il profondo disprezzo per le rappresentazioni filosoficamente orientate o ispirate a una concezione del mondo. Si tratta di conoscenza impura, rappresentazione inautentica propinata per scopi reconditi che tendenzialmente hanno a che fare con il potere. I più sordidi fra i propalatori di pregiudizi siffatti sono i “pundits”, i cosiddetti esperti, gli opinionisti, i columnist, le “talking heads” che prevedono il prossimo crollo dei mercati o la prossima ondata di antieuropeismo alle amministrative e se poi non succede pazienza, pochi se ne cureranno e si passerà tutti alla prossima previsione sbagliata. Silver ha spiegato al New York Magazine che “un sacco di opinionisti hanno un quoziente intellettivo molto alto, ma non hanno nessuna disciplina nel modo in cui guardano il mondo, e questo genera un sacco di stronzate”. Un sacco di stronzate è l’inevitabile risultato prodotto da sedicenti maître à penser che “non accettano la complessità nel loro pensiero. Da prove molto deboli tirano conclusioni enormi. Sono ironicamente prevedibili di settimana in settimana”. I “pundits”, ricci per vocazione, tendono a sbagliare previsioni.

Il sito pundittracker.com tiene conto delle previsioni fatte dagli esperti e dà loro un voto a seconda delle performance: Nouriel Roubini, per fare un esempio, ha uno score sotto il 50 per cento: investireste i vostri soldi sui suggerimenti di uno che c’azzecca la metà delle volte? Il cialtronismo degli esperti di politica alla prova dei fatti era già stato dimostrato dallo psicologo Philip Tetlock in un libro fondamentale per capire l’arte in cui si esercita Silver: “Expert Political Judgment: How good is it? How can we know?”. Con che metodo ha stabilito che gli esperti sbagliano? Ha fatto i conti. Per vent’anni ha tracciato ipotesi e previsioni su tutti gli ambiti della vita politica, li ha messi a confronto con ipotesi e previsioni fatti da perfetti sconosciuti, uomini della strada, ricavandone un’evidenza more geometrico demonstrata: i primi non sono più affidabili dei secondi nella comprensione e previsione dei fenomeni. A morte gli esperti, dunque. Questa è la conseguenza più ovvia dello iato insanabile fra volpi e ricci, fra conoscenza pura e impura, fra dati “theory-free” e wishful thinking imbevuto di ideologia e potere.

Rimangono tuttavia aperte drammatiche domande intorno ai nessi, alla natura della causalità nell’epoca dei “big data”, sulla possibilità effettiva di liberarsi da ogni pregiudizio per far emergere i puri fatti e sui giudizi di valore che in qualche modo resistono alla reductio ad datum. A pochi giorni dal lancio del sito, Silver è rimasto invischiato in una polemica con Paul Krugman, che è uomo di numeri abituato a giustificare con i dati le proprie affermazioni – con rigore nell’ambito accademico, un filo meno in veste di columnist – che contestava non una previsione specifica, ma lo stesso impianto metodologico di FiveThirtyEight: “Non puoi essere una volpe efficace soltanto lasciando che i dati parlino da soli, perché non succede mai. Puoi usare i dati per informare la tua analisi, puoi lasciare che i dati falsifichino la tua ipotesi, ma i dati non sono mai i sostituti del pensiero. Se pensi che i dati parlino da soli, stai implicitamente teorizzando, il che è una pessima idea (perché non puoi mettere alla prova le tue ipotesi se non sai che stai facendo delle ipotesi)”. L’osservazione è cruciale, ma è la risposta di Silver a essere ancora più significativa, perché non poteva che opporre un’argomentazione numerica e lasciare che i dati parlassero da soli. Con una semplice tabella ha spiegato che Krugman ha menzionato nel suo blog Silver o ThirtyFiveEight in tutto 33 volte. Quando quello di Silver era un blog indipendente o era incastonato nel sito del New York Times il premio Nobel tendeva a citarlo in modo positivo, mentre da quando è passato sotto l’etichetta di Espn le menzioni krugmaniane sono stabilmente negative. In queste osservazioni Silver scorge un pattern, lo esibisce e lascia che i dati parlino da soli. Ma cosa dicono i dati? Che Krugman ha preso ad attaccare il giovane “data journalist” semplicemente perché ha cambiato datore di lavoro. Non sarà che invece Krugman ha cambiato opinione perché qualcosa nel metodo di Silver è cambiato? O perché il manifesto ideologico non lo convince? O perché non ha digerito i peperoni? Dov’è la ricchezza di variabili della volpe in questa analisi? C’è una strana aria di monismo ideologico in questa risposta numericamente univoca e perentoria.

Leon Wieseltier, irriducibile umanista e nemico di ogni riduzionismo della conoscenza alla sua natura numerica, arriva a una conclusione analoga partendo dalla sponda dei giudizi di valore: “Molte delle questioni di cui dibattiamo non sono questioni di fatto ma questioni di valore. Non c’è una risposta numerica alla domanda se un uomo debba o meno sposare un altro uomo, o se lo stato debba aiutare i deboli, o se dobbiamo intervenire contro i genocidi. Quindi l’intimidazione tramite quantificazione di Silver e altri mullah dei dati deve essere contrastata. Viva i fatti! Abbasso il culto dei fatti!”. Il “culto dei fatti” è quello che, mettendo l’accento sull’aspetto ideologico, David Brooks chiama “datismo”, una forma di fiducia incondizionata nel potere dei nudi dati di spiegare e tendenzialmente prevedere qualunque fenomeno, dal campionato di baseball alla riforma fiscale. In fondo al cuore Nate Silver è un riccio.

Mattia Ferraresi

Mattia Ferraresi

Nato nella terra di Virgilio e cresciuto in quella di Tassoni, ora vive nel quartiere di Tony Manero. E’ il corrispondente dagli Stati Uniti. Ama, con il necessario distacco penitenziale, il Lambrusco e l’Inter. Ha scritto alcuni libri su cose americane e non, l’ultimo è “La Febbre di Trump” (Marsilio). Sposato con Monica, ha due figli, Giacomo e Agostino.

Più Visti

Lascia il tuo commento

Condividi le tue opinioni su Il Foglio

Caratteri rimanenti: 1000

Servizi