Chi ha dato i numeri sul Covid

Enrico Bucci 26 ott 2020

Prima della politica e dei dpcm. Virologi, epidemiologi, fisici e qualche sgangherato ricercatore a tu per tu con la pandemia. Quanto contano i modelli, le analisi, lo studio quantitativo. Che cosa ha imparato l’Italia dai dati e che cosa invece rischia di sbagliare. Un’indagine

Persone che danno i numeri. Se non fosse che questa frase è ambigua, uno dei modi per riferirsi agli scienziati potrebbe essere questo. Eppure, nell’immaginario comune di questo periodo che sta portando l’uomo della strada al limite dell’esasperazione, il senso proprio – quello per intenderci di Galileo, quando si riferiva alla descrizione dell’universo come un gran libro scritto nel linguaggio dei numeri che gli scienziati devono saper leggere – si sta pericolosamente confondendo con quello volgare, con l’immagine cioè dei tecnici e dei ricercatori quali sgangherati propalatori di numeri e dati senza utilità.

Anzi: persino alcuni ricercatori, principalmente di area clinica, hanno alimentato il mito che esisterebbe una sorta di “intuito scientifico”, di cui in tempi di epidemia il più importante è il “senso clinico”, che permetterebbe quasi di toccare con mano la realtà e dare le indicazioni migliori attraverso la vicinanza diretta alla fonte di osservazione – in questo caso i malati.

Questa idea distorta del lavoro scientifico e della sua base quantitativa, anzi del suo stesso linguaggio numerico, è stata rafforzata dal proliferare di curve, tabelle di dati, intervalli di confidenza e di tutto il bestiario multiforme di simboli e quantità utilizzate da virologi, epidemiologi, fisici, ingegneri che quotidianamente riversano le loro considerazioni su ogni canale mediatico immaginabile.

Ma che significa questa baraonda di considerazioni, a volte anche discordi? Come mai non si ha una voce univoca da parte della comunità scientifica, che ci dia le informazioni in modo uniforme, fatti salvi naturalmente i sempiterni eretici, pseudoscienziati e affini che sono presenti naturalmente anche fra i ricercatori?

Per orizzontarsi e dare una risposta a questa domanda, è indispensabile che il pubblico condivida almeno alcune delle più elementari nozioni sul ruolo di numeri, modelli, predizioni e descrizioni nelle scienza naturali e nell’epidemiologia in particolare; e nell’assumermi il compito di fare un tentativo che spero risulti convincente per il lettore, ne approfitterò per esaminare da vicino quel che sta succedendo nel nostro paese, sia tra gli scienziati che fra i miei concittadini, terreno di conquista di SARS-CoV-2. Cominciamo quindi dall’inizio.

Che cosa sono i modelli?

Se ci fosse chiesto a bruciapelo che cosa sia un modello, forse molti di noi farebbero riferimento alle riproduzioni in scala di qualche oggetto fisico reale, un po' come i galeoni in bottiglia o le perfette riproduzioni di certe automobili. In realtà, per lo scienziato un modello è qualcosa di sostanzialmente diverso: è un sistema che non riproduce ciò che si intende studiare, se non nelle parti indispensabili al fine di descrivere il comportamento dell’oggetto di studio nella sua interezza. Nel caso ideale, l’oggetto di studio può essere modellato puramente mediante l’utilizzo di equazioni matematiche, le quali “sollecitate” opportunamente con dei numeri chiamati “parametri” dallo scienziato, producono un risultato che predice il comportamento dell’oggetto di studio reale nelle condizioni di interesse.

Detta così, può sembrare una procedura complicatissima: in realtà, noi continuamente costruiamo modelli mentali della realtà sotto forma di semplici equazioni, diamo valore ai parametri di queste equazioni e calcoliamo il risultato utile che ci interessa. Farò un semplice esempio di questa stupefacente capacità del nostro cervello. Immaginiamo di voler sapere se ci troveremo in tempo per pranzare con degli amici che abitano a Roma, partendo ad esempio da Napoli. Per saperlo, immagino che tutti cercheremmo innanzitutto qual è il valore della distanza da percorrere da casa nostra a Napoli fino a casa dei nostri amici a Roma; poniamo che la strada da percorrere sia in totale lunga 200 km. La seconda informazione che ci serve – l’ora di partenza – può essere da noi arbitrariamente scelta; possiamo cioè stabilire di voler partire alle 10 del mattino. Infine, il terzo parametro – la velocità media a cui viaggeremo – può essere scelto arbitrariamente da noi in un certo intervallo, poniamo da 90 a 130 km/ora. Scegliendo di viaggiare ad una media di 100 km/h, sappiamo a questo punto con certezza che in 2 ore arriveremo a casa dei nostri amici, dovendo percorrere 200 km a 100 km/ora; ed essendo partiti alle 10 del mattino, arriveremo in tempo per il pranzo.

Cosa abbiamo fatto? Abbiamo estratto dal mondo reale tre parametri numerici – per la nostra auto una velocità media, per la strada una lunghezza ed infine l’ora di partenza – e abbiamo risposti alla nostra domanda iniziale: sì, arriveremo in tempo per il pranzo. Non abbiamo avuto bisogno di sapere quanti alberi fiancheggiavano la strada, di che cilindrata o colore era la nostra auto, né il suo peso e nemmeno se il cielo fosse azzurro o grigio: da tutto il complessissimo mondo che colpirà i nostri sensi durante il viaggio, cioè, noi abbiamo estratto tre numeri, abbiamo usato un’equazione matematica – cioè una legge che data la velocità media e la distanza da percorrere ci permette di calcolare il tempo che ci impiegheremo – e abbiamo ottenuto una predizione di quanto accadrà: arriveremo in tempo. Abbiamo cioè costruito un modello del nostro viaggio particolare, trasformando la realtà in numeri, inserendo questi numeri in un modello generale – una legge che correla quei numeri in modo preciso - e abbiamo quindi ottenuto la risposta che ci interessava.

Ottenere modelli generali della realtà come l’equazione che lega distanza, tempo e velocità media di un corpo in movimento è esattamente il mestiere degli scienziati; ed il perché questi modelli debbano essere espressi matematicamente, credo sia chiaro dallo stesso esempio che abbiamo appena svolto: i numeri sono un modo comodo di eliminare ogni “particolare” per studiare il comportamento collegato di grandezze di interesse.

Alla fine, quindi, un modello della realtà è una rete di equazioni (cioè di relazioni matematiche di uguaglianza e di operatori matematici come moltiplicazione, addizione e così via) che lega alcune grandezze diverse (la lunghezza della strada e la velocità media nel nostro esempio), le quali, una volta che siano determinate (o attraverso una scelta, come nel caso della velocità, o attraverso una misura, nel caso della strada), divengono utili a determinare il valore assunto da altre grandezze (il tempo di percorrenza e quindi il tempo di arrivo se è noto quello di partenza).

Nel nostro esempio, la bellezza del modello matematico che abbiamo usato consiste nella sua semplicità: i calcoli necessari ad utilizzarlo si possono fare a mente, e la sua applicabilità è molto ampia – non importa se a fare il viaggio sarà un’auto, un cavallo, un legionario romano o un missile supersonico, e non importa neppure se la distanza da percorrere è sul nostro pianeta o nello spazio siderale.

Tuttavia, anche modelli come quello illustrato trovano alcuni limiti di applicabilità, cioè alcune limitazioni alla loro generalità. Se per esempio viaggiassimo a velocità della luce (quindi spingessimo a limiti estremi uno dei parametri del calcolo), scopriremmo alcuni strani effetti che legano spazio da percorrere e tempo impiegato.

Anche se non ci interessa descrivere qui nel dettaglio questi effetti, il punto è che anche modelli matematici molto semplici e di amplissima applicabilità hanno dei limiti, che bisogna conoscere, per utilizzarli; questo accade non perché i modelli siano insufficienti, ma perché in certe condizioni alcune grandezze e le relazioni matematiche tra di esse non sono descritte accuratamente dalla nostra semplificazione originale; dobbiamo introdurre nel modello parti di realtà che, in altre condizioni (come quelle del viaggio da Napoli a Roma), sono del tutto irrilevanti ai fini dell’informazione che intendiamo ottenere.

Dunque, sebbene a questo punto dovremmo aver capito cosa siano e perché siano utili i modelli (matematici) che usano gli scienziati, abbiamo anche introdotto un aspetto importante: nessun modello è applicabile in qualunque condizione, perché rappresenta sempre una semplificazione che può perdere aspetti cruciali in condizioni particolari. Lo studio delle condizioni di applicazione dei modelli è quindi un altro, importantissimo campo di indagine degli scienziati, che serve per esempio a stabilire quando posso usare un modello classico e semplice (in casi come quello del viaggio Napoli-Roma) e quando invece devo usare un modello diverso e più complesso, come quello relativistico (per esempio per calibrare le informazioni ottenute dai satelliti GPS).

Vi è poi da considerare un ulteriore limite nella precisione della risposta che riusciamo ad ottenere dall’utilizzo di un modello matematico. Almeno una parte dei parametri necessari a produrre una risposta utilizzando le equazioni di un modello devono essere determinati sperimentalmente. Nel nostro semplicissimo esempio, dobbiamo fornire al modello la lunghezza della strada da percorrere, che abbiamo indicato essere 200 km; ma essa potrebbe in realtà essere lunga 200 km e 10 centimetri, oppure 199 km, 999 metri e 80 millimetri. Noi, tuttavia, non useremo mai la lunghezza reale della strada per fare i conti, perché in realtà non la conosciamo se non approssimata al km; dunque, siamo costretti ad ammettere che il nostro calcolo finale sarà affetto da un errore, perché la strada in realtà non sarà lunga esattamente 200 km. Per questo, la nostra stima finale, se fossimo molto pignoli, potrebbe essere una forchetta, invece che un valore singolo, la cui ampiezza è determinata dal valore del tempo di percorrenza ottenuto assumendo una lunghezza di 199 km e quello ottenuto assumendo una lunghezza di 201 km. In altre parole, le incertezze delle misure, ineliminabili, si tradurranno in un margine di incertezza nella risposta che otteniamo dal nostro modello matematico; è per questo che, per ogni numero fornito dagli scienziati, deve essere indicato quale sia il margine di incertezza (ovvero l’errore massimo e minimo sotto certe assunzioni).

Quanto le incertezze sui numeri che mettiamo nei nostri modelli influiscono sull’incertezza nella risposta che abbiamo è una delle caratteristiche intrinseche del modello stesso; come vedremo, esistono tipi di modello (e quindi modi di funzionamento della realtà da essi descritta) in cui incertezze relativamente piccole nella conoscenza dei fatti che usiamo per alimentare i nostri modelli, producono margini di errore molto grandi nelle risposte che otteniamo.

Ricapitoliamo, prima di passare avanti. Abbiamo visto che tutti, bene o male, usiamo i numeri per cogliere gli aspetti essenziali della realtà che ci servono per alimentare modelli matematici utili a risolvere problemi anche quotidiani; gli scienziati, per mestiere, cercano i migliori modelli per interpretare fenomeni diversi e per rispondere ad ogni tipo di domande; tutti i modelli hanno dei limiti di applicazione, che sono oggetto di studio da parte degli scienziati stessi; ogni modello, essendo alimentato da numeri che potrebbero essere affetti da un certo margine di errore, produce in uscita delle risposte pure esse affette da un margine di errore, la cui ampiezza però dipende non solo dall’errore iniziale, ma pure dal tipo di modello e quindi dal tipo di realtà fisica descritta.

Modellare la pandemia

Di fronte alla pandemia, ovviamente, tutti ci poniamo domande circa la sua origine, il suo svilupparsi ed il suo futuro. Per rispondere a queste domande, proprio come nel caso della domanda sul pranzo a Roma con gli amici, abbiamo bisogno di un modello. In particolare, ci serve un modello che come minimo racchiuda nelle sue equazioni come il virus si propaga da individuo ad individuo, quali sono i fattori che influenzano questa propagazione e, se vogliamo sapere anche quanti malati e quanti morti ci saranno, anche quale sia la frequenza con cui tali condizioni si verificano nei soggetti infetti e se questa frequenza dipenda da altri fattori.

Esiste un modello come questo? In realtà, ne esistono tantissimi diversi. Anzi, continuamente se ne propongono di nuovi, alla ricerca del “modello perfetto” che sia più semplice possibile (abbia cioè bisogno di conoscere poche grandezze al punto di partenza) ma più generale possibile (descriva cioè non solo l’attuale pandemia, ma qualunque manifestazione epidemica passata, presente o futura). Questi modelli differiscono non solo e non tanto per i parametri che incorporano (ricordiamo che i parametri sono quelle grandezze della cui misura abbiamo bisogno, perché il modello attraverso le sue trasformazioni matematiche ci dia una risposta), ma anche e soprattutto per le equazioni e gli operatori matematici che collegano questi parametri tra di loro per fornire la risposta finale.

Ma perché ci sono tanti modelli diversi? Forse perché ogni scienziato è affezionato ad uno in particolare e vuole differenziarsi dagli altri? Magari fosse questa la ragione! In realtà, la situazione è più complicata, ed è grosso modo questa. Per ottenere un buon modello epidemiologico, noi dovremmo conoscere innanzitutto quali sono i parametri che contribuiscono significativamente all’infezione delle persone e alla loro risposta alle infezioni. In realtà, i possibili parametri “candidati” per ottenere un buon modello epidemiologico sono diversi da virus a virus, perché, per esempio, un virus può essere sensibile alla temperatura ambientale ed un altro meno, ed anche perché noi stessi possiamo comportarci diversamente a seconda del virus, ad esempio se il virus si diffonde anche a partire da soggetti asintomatici o meno. Quando siamo di fronte ad un nuovo virus, come SARS-CoV-2, non sappiamo quali e quanti siano i parametri da prendere in considerazione per costruire un modello della sua diffusione nella popolazione umana.

Non solo: all’inizio di una epidemia, non abbiamo nemmeno a disposizione gli elementi che ci servono per determinare quali siano quei parametri. Non abbiamo, per esempio, sufficienti dati per determinare se il virus si propaga diversamente in paesi caldi e freddi; e guardare troppo presto ai dati (come si è fatto nei primi mesi della pandemia) può portare a sovrainterpretare le differenze apparenti tra paesi, dovute magari ad altri fattori (come il fatto che molti paesi caldi sono meno collegati al resto del mondo, e quindi il virus potrebbe essere arrivato più tardi in quei paesi).

Tuttavia, i modelli servono subito, perché il pubblico (e i governi) non possono attendere che si sia svolto un esperimento naturale imperturbato, in cui le cavie sono loro stessi; e dunque gli scienziati cercano – e sottolineo cercano – di indovinare quali siano i fattori più importanti dai pochi dati disponibili e forniscono dei modelli per cercare di predire l’andamento della pandemia. A questo punto, accade l’inevitabile: ciascuno scienziato, con il suo particolare bagaglio di esperienza e conoscenza, è portato a dare più peso a questo o quel fattore, spesso sulla base di ottimi motivi, che solo a posteriori risulteranno erronei; e dunque ciascuno scienziato è nella condizione di formulare modelli, i quali sono poco o molto diversi da quelli dei suoi colleghi, per il semplice fatto che ogni modello incorpora parametri diversi, collegati matematicamente tra loro in modo diverso.

Naturalmente, ogni scienziato ed il pubblico che lo segue sono poi in trepida attesa per verificare cosa il modello prevede per il futuro e quanto effettivamente i dati che man mano arrivano siano conformi a quella predizione; questo per lo scienziato trova ragione nell’idea di aver capito cosa sta succedendo, e per il pubblico nell’idea di avere un minimo di controllo su cosa accadrà – l’idea di saperlo, infatti, è di per sé rassicurante perché permette di scegliere cosa fare.

Tuttavia, presto il pubblico si è reso conto che i modelli messi a punto inizialmente dagli scienziati non solo hanno indicato scenari che non si sono mai realizzati, ma soprattutto, anche quando hanno nella maggior parte dei casi predetto qualitativamente cosa sarebbe successo, non sono mai riusciti ad ottenere quel livello di accuratezza necessario per fondare su di essi molte delle nostre scelte.

Oltretutto, se sono presenti tanti modelli diversi che divergono anche nelle loro previsioni, come fare ad identificare in anticipo quello corretto? In realtà, ci si potrebbe chiedere come mai, in presenza ormai comunque di dati da tutto il mondo per svariati mesi sul procedere della pandemia, a questo punto non sia possibile eliminare tutti i modelli sbagliati e convergere su un modello unico, che sia in grado sia di descrivere cosa è successo che di prevedere con un margine di errore determinato cosa succederà in futuro. È un’ottima domanda, a cui vale la pena di rispondere considerando un elemento che abbiamo anticipato all’inizio: nel caso delle epidemie, come in molti altri fenomeni naturali, piccole variazioni iniziali possono portare a risultati molto diversi.

Il virus e la farfalla

Probabilmente molti conoscono, almeno a grandi linee, la definizione di effetto farfalla. Per una concatenazione di eventi, ciascuno dei quali amplifica il precedente in maniera non prevedibile, il battito d’ali di una farfalla potrebbe in linea di principio portare ad un uragano. In realtà, in questa bella immagine sono racchiusi alcuni elementi importantissimi della cosiddetta teoria del caos deterministico.

Il primo elemento è che noi ignoriamo totalmente quale sia la particolare farfalla che deve battere le ali in un certo modo per provocare un certo effetto catastrofico. Di moltissime farfalle osservate, nessuna è nota per aver provocato nemmeno una brezza marina; e di moltissimi uragani osservati, nessuno è stato ricondotto ad una particolare farfalla.

Se facessimo una collezione di tutte le possibili farfalle e specificamente anche di tutti i possibili battiti d’ala, vedremmo che solo alcuni – che magari differiscono pochissimo da altri – porterebbero ad eventi di qualsivoglia genere. In questa immagine bellissima, se fosse vero che le farfalle possono provocare cicloni, gli effetti finali del battito dipenderebbero specificamente dal tipo di battito in modo imprevedibile e legato a impercettibili variazioni della posizione dell’ala, della forza con cui è battuta e così via. Piccolissime variazioni per noi imperscrutabili, cioè, nella nostra metafora porterebbero a diversissimi effetti; e siccome quelle piccolissime variazioni imperscrutabili a noi non sono evidenti, avremmo l’impressione finale che il legame tra battito e ciclone sia di tipo casuale e caotico.

Cosa c’entra tutto questo con le epidemie? Il punto è questo: anche l’innesco ed il tipo di progressione che avrà un’epidemia sono fenomeni che dipendono strettamente da condizioni iniziali per le quali piccole differenze possono determinare risultati radicalmente diversi. Questo causa un grosso problema anche nel cercare di ottenere modelli basati su serie storiche di dati disponibili. Infatti, se piccole variazioni danno esiti radicalmente diversi, quello che sto osservando a posteriori come serie di dati non è rappresentativo altro che di un piccolo insieme limitato di condizioni iniziali; ma siccome non conosco queste condizioni con precisione, né conosco il modo in cui queste esse influenzano la crescita epidemica – anzi questo è proprio ciò che sto cercando di ottenere, se sto costruendo un modello – sono in un vicolo cieco, perché non posso fare assunzioni ragionevoli su quale fosse il punto di partenza che ha portato allo sviluppo che sto osservando, e di conseguenza non posso ricavare dai dati che osservo il peso dei diversi parametri iniziali nel determinare la crescita confrontando curve di crescita partite da stati iniziali diversi.

È come se avessi mesi di osservazioni sul formarsi di fronti nuvolosi in tanti paesi diversi, e mi si chiedesse di determinare in che modo si formano le perturbazioni – di avere cioè un modello generale che spieghi come le perturbazioni nascono e crescono. I dati osservazionali, quindi, servono a poco per modellare le epidemie da coronavirus; tanto più poi quando essi sono rumorosi, mal campionati e confusi, poiché vengono raccolti in situazioni di emergenza e per scopi diversi, più attinenti alla clinica, e quindi non sono i dati giusti.

Questo significa che tutte le previsioni su tempi sufficientemente lunghi (diciamo un mese) basate sull’andamento passato delle curve epidemiche, se non sono di tipo puramente qualitativo, sono destinate ad infrangersi con l’emergere di andamenti nuovi ed imprevisti della curva epidemica; il che è precisamente quello che si è osservato ovunque nel mondo in questo periodo.

Piccoli eventi apparentemente insignificanti, che sfuggono alla nostra osservazione: sono questi che determinano come nasce un’epidemia e anche come se ne modifica il corso, ragion per cui nessun modello potrà prevedere in maniera accurata cosa succederà tra un mese. Allo stesso tempo, questo è il motivo per cui i ricercatori continuano ad elaborare modelli nuovi, che incorporino fenomeni precedentemente sfuggiti all’osservazione e poi rivelatisi importanti, man mano che la pandemia va avanti e questi fenomeni emergono con più chiarezza.

Ma allora a che serve la matematica delle epidemie? È solo un divertimento degli scienziati, che intendono torturare il pubblico con le loro previsioni variegate?

Il potere dei numeri

In realtà, vi sono alcune informazioni utili che possiamo ricavare dall’analisi matematica delle epidemie – presenti, passate e future – che sono comunque di interesse, anche se dobbiamo rinunciare a sapere quando precisamente inizierà una nuova ondata epidemica, o che altezza raggiungerà, o quando arriverà il picco della seconda ondata oggi in corso in Italia ed in molte nazioni europee.

Rinunciamo pure alla determinazione precisa dei parametri che governano le nostre equazioni, e quindi il punto di inizio, l’altezza e la durata di una curva epidemica, perché sono sfuggenti, variabili e dominano lo sviluppo epidemico secondo lo scenario dell’effetto farfalla (e quindi secondo le leggi del caos deterministico).

Possiamo però sempre considerare la forma delle curve epidemiche, che a sua volta è descritta da funzioni matematiche. La più celebre di queste funzioni è l’esponenziale, che descrive bene sia la salita iniziale di una curva epidemica che la sua discesa dopo il picco. Come ho scritto più volte, questa curva è caratteristica dell’esplosione epidemica non per capriccio, ma perché descrive esattamente il fenomeno di replicazione del virus a partire da un soggetto che ne infetta altri, i quali a loro volta si comportano nello stesso modo, almeno finché il serbatoio di persone infettabili a disposizione sia virtualmente illimitato o comunque molto più grande del numero di persone già infettate.

Ora, aver compreso – già da qualche secolo – che le epidemie si propagano per definizione in questo modo, significa sapere che ciò che conta per descrivere quanto sta succedendo è il numero medio di persone infettate da ogni soggetto ed il tempo in cui questo processo avviene. D’altra parte, visto che questi due parametri controllano la fase esponenziale della crescita epidemica, è ovvio che le misure da adottare sono tutte quelle che rendano più piccolo il numero medio di persone infettate da ogni infetto (il famoso Rt) e allunghino il tempo in cui queste infezioni eventualmente si realizzano. La diminuzione del numero medio di contatti efficaci nel trasmettere il virus (contatti senza mascherina e per tempi di almeno 15 minuti) con persone diverse nel tempo raggiunge entrambi gli scopi, per cui tutte le misure che vanno in questo senso hanno ovviamente un’efficacia proporzionale alla loro abilità di isolarci dai contatti come estranei. Un isolamento totale sarebbe l’ideale per spegnere il virus, ma questo distrugge la vita degli individui, in tutti i sensi e di qualunque individuo, perché siamo una specie sociale; dunque è molto difficile credere che l’isolamento totale sia una misura attuabile o consigliabile per sconfiggere il virus, se non come “freno di emergenza” per brevi periodi.

I numeri, ancora una volta, ci vengono in aiuto: possiamo letteralmente “sperimentare” varie misure diverse, dalle mascherine alla restrizione degli assembramenti e così via, e misurare il loro effetto sul numero medio di contagiati da ogni soggetto infetto (il famoso Rt) e sul tempo necessario perché queste infezioni si realizzino.

Notate la differenza: in questo caso, invece di decidere quale sarà il futuro, sto usando le proprietà matematiche di una curva, la quale è radicata nella descrizione qualitativa del processo di infezione, per determinare alla fine quale deve essere il comportamento da adottare in presenza di una epidemia. Non solo: sapendo che la fase esponenziale di un’epidemia è la prima, e sapendo che la forma di un’esponenziale è tale da partire inizialmente con numeri molto piccoli, per poi impennarsi improvvisamente, devo tenere sotto controllo non i numeri assoluti di infetti, malati o morti in un certo periodo di tempo, quanto piuttosto le variazioni nel tempo di questi numeri. Un aumento per un tempo sufficientemente prolungato, per quanto piccolo e per quanto osservato su numeri piccolissimi, è esattamente ciò che ci si aspetta quando comincia una nuova crescita epidemica, quando cioè siamo nella “coda iniziale” dell’esponenziale.

La cattiva comprensione di questo fatto ha portato molti specialisti a reagire molto male, quando il 16 agosto, dopo aver osservato per 10 giorni un trend di aumento nelle terapie intensive, annunciai il possibile arrivo della seconda ondata che stiamo vivendo; numeri piccolissimi, si diceva, imparagonabili a quanto osservato fra marzo e aprile, di nessuna preoccupazione e dunque allarme ingiustificata o addirittura dolo terroristico per ricevere attenzione.

Oggi quegli stessi specialisti si dicono sorpresi della ripresa del virus, ma ovviamente la sorpresa è che loro siano sorpresi; la semplice considerazione per una realtà che è descrivibile qualitativamente con una legge matematica, l’esponenziale, li avrebbe posti al riparo dai numerosi abbagli che hanno preso, pure essendo molto esperti nei loro settori. Naturalmente, se l’unico aiuto che potessimo avere dai numeri fosse la descrizione qualitativa delle varie fasi dell’epidemia, non avremmo bisogno di una epidemiologia quantitativa. In realtà, vi sono altri aspetti in cui i numeri possono aiutarci. Per esempio, altri numeri, che sono compresi nei modelli di sviluppo qualitativo di ogni epidemia, possono dirci che cosa osserveremo nel futuro prossimo – non in quello remoto – un po’ come avviene per le previsioni del tempo, che devono anch’esse fare i conti con fenomeni basati sul caos deterministico. In particolare, i tempi che intercorrono tra l’infezione, il ricovero in ospedale ed eventualmente il ricovero in terapia intensiva ci permettono di anticipare dall’osservazione di una curva – per esempio quella dei soggetti positivi sintomatici – cosa succederà alle altre due nel prossimo futuro, noto il ritardo tra una curva e l’altra. Questa informazione permette di guadagnare un po’ di tempo per prepararsi negli ospedali, sapendo che alla crescita di una curva seguirà immancabilmente quella delle altre; per cui è della massima importanza cercare, con opportuni strumenti statistici, di determinare questi ritardi con la massima precisione possibile.

Anche questo aspetto è spesso sfuggito ad osservatori casuali del fenomeno epidemico, che alla ripresa dei casi di infezione hanno per esempio scambiato l’assenza di morti dovuta al ritardo con cui la curva corrispondente comincia a crescere con un miglioramento drammatico della prognosi dell’infezione, dovuto alle terapie o ad un fantomatico cambiamento del virus. Non voglio escludere che oggi si riesca a fronteggiare meglio il virus, ma i dati ed i fatti portati a sostegno di questa ipotesi non consideravano il bias del ritardo fra le varie curve, o altri fattori di bias quali il cambio della demografia degli infetti per un virus che agisce diversamente sulle varie fasce di età. Al contrario, l’analisi numerica ha potuto rapidamente fare giustizia delle fantasiose ipotesi su virus rabboniti o clinicamente estinti, proprio prendendo in conto la distribuzione per età degli infetti e il ritardo non solo nel passaggio di un soggetto fra i vari stati di infezione, malattia e terapia intensiva, ma ulteriori fattori distorcenti.

Infine, vale la pena di accennare ad un ulteriore, utile funzione della modellizzazione matematica delle epidemie. Si tratta della possibilità, sotto certe condizioni opportune, di ricavare nuove informazioni sul virus, escludendo quei modelli della sua propagazione che non funzionano. Mi spiego meglio: supponiamo di voler testare l’ipotesi che il caldo porti ad una certa diminuzione percentuale dell’infettività del virus, per esempio agendo sul famoso fattore Rt. Supponiamo anche che questa diminuzione sia così rilevante, da poter essere un fattore determinante da tenere in considerazione.

Possiamo testare l’ipotesi costruendo un opportuno modello matematico, che a partire dalle temperature diverse misurate in luoghi diversi, ci consenta di ottenere il valore di Rt misurato in quei luoghi nel periodo di tempo in cui è stata misurata la temperatura. Se questo modello esiste, la temperatura sarà certamente da tenere in considerazione, naturalmente sempre che io abbia fatto le cose per bene, e non abbia scelto il campione di misure da cui costruire il mio modello in maniera da soddisfare in partenza alla mia ipotesi. In caso contrario, se non ottengo nessun modello o se devo “complicare” troppo il mio modello per avvicinarmi alla verifica dell’ipotesi, posso escludere che la temperatura sia un fattore determinante nella progressione dell’epidemia.

Come per la temperatura, questo tipo di analisi e modellizzazione può estendersi a diversi fattori di cui io voglia testare la significatività ai fini della moltiplicazione del virus; e questo, naturalmente, è utile sia che escluda il peso di certi fattori, sia invece (caso più raro) che mi porti alla scoperta di elementi importanti.

Conclusione

Ho usato una selezione di argomenti, per cercare di far intuire al lettore quale sia la ragione del proliferare di modelli e numeri durante questa epidemia, a fronte di un apparente loro scarso successo predittivo; ma anche per mostrare come vi sia utilità nei numeri e nelle funzioni matematiche, quando per un fenomeno retto almeno in parte dalle leggi del caos deterministico, si metta da parte la voglia di ottenere numeri troppo precisi e si guardi alle indicazioni che lo studio delle funzioni matematiche che descrivono tutte le epidemie possono darci. Vi sarebbe ancora moltissimo da scrivere in proposito, essendomi volutamente limitato a pochi, semplici elementi; e tuttavia mi preme lasciare un messaggio in conclusione.

Come abbiamo visto, ogni ragionamento scientifico, ogni modellizzazione dipende da dati, sia per il monitoraggio, che per la descrizione che per la previsione; non si può chiedere a nessuno scienziato un parere o una previsione, senza prima fornirgli numeri e dati, o fornendo dati di qualità scarsa o non controllabile.

Se vogliamo capirci qualcosa, è della massima importanza curare i numeri, prima di cercare di costruire modelli per utilizzarli.

Di più su questi argomenti:

Chi ha dato i numeri sul Covid

Che cosa sono i modelli?

Modellare la pandemia

Il virus e la farfalla

Il potere dei numeri

Conclusione

L'ottimismo di Schillaci e Meloni sul decreto liste d'attesa, ma per alcuni esami si aspetta più di un anno

Il decreto sulle liste d'attesa in sanità cambierà ben poco

Fedez dopo il ricovero: "Alcol e droghe? Ricostruzioni da fantascienza"

Ecco quanto costa alla salute italiana il ritardo sul Mes

La verità vi prego sui tamponi

Spiegare, persuadere. I doveri di un'autorità a legittimazione flebile

Che cosa sono i modelli?

Modellare la pandemia

Il virus e la farfalla

Il potere dei numeri

Conclusione