La foto sfocata dell'Istat

Enrico Bucci

I margini di incertezza e le fonti di errore nei dati sull’Italia e il virus ci permettono di capire meglio i numeri

Si fa un gran parlare in questi giorni dei numeri forniti dall’Istat per la sieropositività agli anticorpi contro Sars-CoV-2, ma come sempre, quando si forniscono e si discutono numeri, è bene innanzitutto chiedersi cosa quei numeri rappresentano e quale sia il margine di incertezza e le fonti di errore che li accompagnano. Proverò quindi brevemente a ricordare alcuni limiti di quello che resta, a mio giudizio, un encomiabile tentativo di riportare i fatti al centro del discorso pubblico, effettuando misure su larga scala che certamente sono costate fatica e lavoro, oltre che soldi del contribuente.

 

Prendiamo quindi il numero principale fornito dal nuovo rapporto Istat: estrapolando da un campione di quasi 65 mila persone, il 2,5 per cento degli italiani risulta positivo agli anticorpi IgG contro il virus. L’intervallo di confidenza al 95 per cento fornito per questa stima va dal 2,3 al 2,6 per cento. Assumiamo che la stima sia corretta, nonostante non si sia raggiunto il previsto numero di 150 mila individui testati. La prima cosa da osservare è che questo numero rappresenta una fotografia “sfocata” nell’arco di qualche mese degli italiani infettati dal virus, i quali sono stati certamente di più, perché oggi sappiamo che le IgG, dopo un certo numero di mesi, possono raggiungere livelli non rilevabili dai test. In questo senso, la stima degli infetti potrebbe essere anche raddoppiata, visto che i prelievi per test sono stati effettuati tra maggio e luglio. Diciamo quindi che la percentuale vera di soggetti guariti dal virus può essere collocata con una probabilità del 95 per cento fra il 2,3 per cento (minimo Istat) e il 5,2 (il doppio del massimo Istat).

 

Vi è poi un fattore che spingerebbe nel senso inverso: l’eventuale reazione del test usato con anticorpi di altri coronavirus, che diminuirebbe il numero di infettati a Sars-CoV-2 effettivamente rilevato. Con gli attuali test sierologici, questo sembra un fattore trascurabile. Vi è infine un’ulteriore interessante fonte di errore da considerare, che è quella collegata alla tecnica utilizzata per effettuare il test, la quale è inerentemente affetta da errori che producono falsi positivi (individui senza anticorpi che risultano positivi al test) e falsi negativi (individui con anticorpi che risultano negativi al test). Nel caso del test che, da protocollo depositato, è stato utilizzato, si ottiene da ampi studi in letteratura che una piccola percentuale (il 2,8 per cento) dei positivi al test potrebbe essere in realtà priva di anticorpi, mentre nessun soggetto negativo al test dovrebbe avere anticorpi contro il virus. Da questo punto di vista, il lavoro fatto non dovrebbe avere errori significativi.

 

In ogni caso, l’identificazione e il trattamento delle fonti di errore illustrate vanno discussi in maniera analitica, e con trasparenza; perché la forchetta sulla stima e il modo in cui è stata determinata sono l’informazione più importante che ci serve di conoscere bene, prima, per esempio, di paragonare letalità e sieroprevalenza osservate nel nostro paese con altre nazioni, o quanto successo in un comune con ciò che si osserva in comuni adiacenti.

 

Come sempre, i numeri servono, ma non senza la descrizione completa della stima dell’incertezza e dei pregiudizi di campionamento che li affliggono; mentre la falsa sensazione di precisione derivante dalla comunicazione di un numero, così come presentato al pubblico e discusso dai cittadini, induce al più grande degli errori, quello della fiducia in cifre che non rappresentano la realtà.

Di più su questi argomenti: