studenti vs intelligenza artificiale

Alle Olimpiadi di matematica l'AI vince l'oro, ma sul quesito più intuitivo sono meglio gli studenti

Marco Arvati 29 lug 2025

DeepThink, una delle AI sviluppate dal team DeepMind di Google ottiene un risultato storico alla competizione matematica, superando cinque dei sei problemi proposti. Rimane indietro su quello più creativo, dove invece brillano gli studenti

Quest’anno le olimpiadi internazionali della matematica si sono svolte in Australia: sei problemi a difficoltà crescente da risolvere in due giorni, 630 ragazzi, un ospite d’eccezione, DeepThink, intelligenza artificiale sviluppata dal team DeepMind di Google. L’AI ha vinto la medaglia d’oro con 35 punti su 42 e cinque problemi risolti su sei. Per quanto riguarda gli esseri umani a prevalere è stata la Cina: i cui due studenti migliori hanno totalizzato il punteggio massimo di 42 punti, davanti agli Stati Uniti e alla Corea del sud. La prima nazione europea in classifica è la Polonia, quarta a pari merito col Giappone, mentre l’Italia ha ottenuto il diciottesimo posto. Quello di DeepMind è un grande risultato, dato che, in media, solo l’8 per cento dei partecipanti raggiunge l’ambito oro e certifica i progressi degli sviluppatori di modelli di intelligenza artificiale nell’ultimo anno. La competizione, infatti, richiede più della mera capacità computazionale, in cui le intelligenze artificiali sono già allenate, ma creatività nell’applicazione matematica e pensiero logico. I giudici cercano di valutare gli studenti sulla capacità di risolvere problemi non convenzionali, mai visionati precedentemente, e questo è uno svantaggio per l’IA, che si allena su enormi moli di informazioni, ma fatica quando si trova davanti problemi mai analizzati in passato.

Nella scorsa competizione DeepMind aveva vinto la medaglia d’argento, ma ora, attraverso il modello sperimentale DeepThink, con una capacità più alta di ragionamento per obiettivi, è arrivato all’oro. Nonostante questo, DeepMind non ha vinto la competizione: ben ventisei studenti hanno totalizzato un punteggio superiore, tra cui anche il nostro Lorenzo degli Atti, classe 2007, che con il risultato di 36 su un massimo di 42 ha sconfitto il team di Google per un punto. Successivamente, anche OpenAI, azienda sviluppatrice di ChatGpt, ha affermato di aver ottenuto la medaglia d’oro al medesimo test, con un proprio modello anch’esso operante a linguaggio naturale e ottenendo gli stessi trentacinque punti di DeepThink. Il ceo Sam Altman, commentando il risultato su X, ha affermato che “quando abbiamo iniziato a occuparci di IA, un risultato di questo tipo era un sogno e questo fa capire i passi da gigante che l’intelligenza artificiale ha compiuto nell’ultimo decennio”. OpenAI non ha partecipato ufficialmente alla gara, come invece ha fatto Google: ha rilasciato i propri risultati a competizione terminata. Secondo Junehyuk Jung, ricercatore di DeepMind, “siamo vicini a una capacità di ragionamento che migliorerà la collaborazione tra l’IA e i matematici”. L’obiettivo è giungere a un miglioramento tale da poter mettere i modelli in mano agli studiosi per risolvere problemi mai affrontati. Ma la perfezione è lontana: nel sesto problema, che richiedeva capacità di intuizione e creatività, DeepThink ha totalizzato zero punti e, secondo Jung, problemi di quel tipo continueranno a mettere in difficoltà i modelli di IA per almeno un altro decennio. Il team di Google può però festeggiare un risultato storico, impensabile solo un anno fa, e lo ha celebrato facendo una cosa che a nessun altro liceale era permessa: ha stappato una bottiglia di whisky.

Di più su questi argomenti:

Alle Olimpiadi di matematica l'AI vince l'oro, ma sul quesito più intuitivo sono meglio gli studenti

Sì al divieto di social under 16, dice la voce dei presidi Giannelli

Oggi il secondo appello per accedere a Medicina. Ma perché non copiare in tutto Parigi?

Nessuna mattanza a Medicina, ma un meccanismo di accesso più serio

Trump smantella le regole sull'AI per vincere la corsa con la Cina

Il caso Nvidia e l'impatto dell'intelligenza artificiale sugli equilibri economici globali