Foto unsplash

cattivi scienziati

La rivoluzione è cominciata. L'intelligenza artificiale apre una nuova èra per la scienza

Enrico Bucci

Alphafold, un programma sviluppato da Google e dal più importante laboratorio paneuropeo di bioinformatica, permetterà di esaminare in dettaglio la struttura tridimensionale di 200 milioni di proteine, quasi tutte quelle note, aprendo le porte a una nuova fase di studi e applicazioni finora impensabili

Grazie al nuovo osservatorio spaziale James Webb Telescope, siamo pronti ad osservare oggetti lontanissimi e di enormi dimensioni. Ma alle sorprese di questo luglio 2022, memorabile dal punto di vista della ricerca scientifica, si è aggiunta ieri un’altra notizia: grazie ad un programma di intelligenza artificiale denominato Alphafold, e grazie ad una collaborazione tra Google e il più importante laboratorio paneuropeo di bioinformatica, l’EMBL-EBI, da ieri possiamo esaminare in dettaglio la struttura tridimensionale di oggetti piccolissimi e vicinissimi a noi, ovvero 200 milioni di proteine, quasi tutte quelle note alla scienza. 

Su queste pagine, a suo tempo, avevamo preannunciato la rivoluzione che Alphafold prometteva: adesso quella rivoluzione è cominciata.

Vediamo di capire cosa è successo, in breve. Credo che tutti abbiamo una qualche familiarità con l’idea che il nostro genoma, fatto di DNA, specifichi il modo in cui siamo fatti; uso termini volutamente generici, per avvicinarmi alla percezione più diffusa e comune. In realtà, il genoma di qualunque organismo, sia fatto di DNA come il nostro o di RNA come quello di SARS-CoV-2, contiene specificato nella sua sequenza le istruzioni per produrre al momento giusto e nella giusta quantità tutte le proteine che costituiscono il grosso del macchinario utile a far funzionare ogni essere vivente. A livello microscopico, cioè, noi siamo un insieme ben regolato di miliardi e miliardi di proteine (da due a 4 milioni in un cubetto di lato pari a 1 milionesimo di metro), il cui inventario (nel caso dell’uomo, qualche decina di migliaia di tipi diversi) è custodito nel genoma di ogni singola cellula. Queste proteine sono gli ingranaggi, o per meglio dire delle macchine di dimensione microscopica, che con le loro funzioni, la loro precisa struttura tridimensionale e le loro proprietà chimico fisiche consentono ad ogni essere vivente di essere ciò che è.

 

La contrazione simultanea di un numero astronomico di copie di certe particolari proteine, contenute nei nostri muscoli, all’arrivo di uno stimolo nervoso, consente di flettere le nostre braccia; il legame dell’ossigeno ad un’altra proteina contenuta nei nostri globuli rossi consente di trasportare quell’indispensabile gas ad ogni cellula del nostro corpo; altre proteine ancora consentono di processare gli alimenti che ingeriamo, dalla ptialina nella nostra saliva fino agli enzimi nel nostro stomaco e nel resto del nostro apparato digerente; proteine specializzate, gli anticorpi, legano e permettono di distruggere i patogeni; altre proteine, come l’insulina, regolano il livello generale di varie molecole nel nostro organismo; proteine ancora diverse consentono di trasmettere gli impulsi nervosi nelle sinapsi dei nostri neuroni; e così via, fino a completare l’inventario di ogni singola funzione fisiologica che permette di vivere a noi e ad ogni singolo organismo.

Proprio come nel caso degli attrezzi di un meccanico, la funzione che le proteine possono esercitare dipende strettamente dalla loro forma, ovvero dalla loro struttura tridimensionale. Guardando una vite penetrare nel legno, capiamo a che serve la sua scanalatura elicoidale; allo stesso modo, per capire come una proteina esercita la propria funzione è necessario esaminarne la struttura e il modo in cui essa, durante l’attività della proteina, agisce sull’ambiente circostante. Inoltre, proprio come possiamo capire che una vite è rotta se notiamo che è piegata, allo stesso modo quando scopriamo che una mutazione di un pezzo del nostro DNA porta alla produzione di una proteina con la forma alterata, possiamo desumerne che essa non funzionerà più come dovrebbe; ciò consente di identificare il meccanismo alla base di molte malattie diverse, e di intervenire ripristinando la proteina corretta – per esempio sostituendo la copia difettosa di un gene, come nella terapia genica, oppure fornendo la proteina funzionante, come nel caso dell’insulina per i diabetici.

Il problema è che, fino ad oggi, ottenere informazioni sulla struttura di una macromolecola biologica era una procedura lunga e complessa: nel 1957, Kendrew rese nota la struttura della mioglobina, dopo 22 anni di lavoro, e nonostante i notevolissimi progressi, nei successivi 65 anni, cioè fino ad oggi, è stata determinata sperimentalmente la “forma” di circa 190.000 proteine. Oggi, in un colpo solo, si è passati ad avere informazione affidabile su 200 milioni di proteine, che, ripeto, sono quasi tutte quelle note; in un sol colpo, vediamo la “forma” di tutte le macchine molecolari, di tutti gli ingranaggi che compongono le cellule e i corpi di ogni organismo vivente per il quale si sia determinato il genoma.

Una nuova era di studi e applicazioni impensabili è cominciata.

Di più su questi argomenti: