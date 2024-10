Sette anni fa il ceo e co-fondatore di Deepmind Demis Hassabis firmava il paper sull'umiliazione inflitta al motore scacchistico Stockfish da AlphaZero che gioca, impara da sé, e da solo raggiunge in poche ore prestazioni superiori a quelle dell’uomo e di ogni altra intelligenza conosciuta

A Londra, in Pancras Square, la storia degli scacchi e quella del mondo si sono toccate, anche se il mondo se n’è accorto solo sette anni dopo, con l’assegnazione del premio Nobel per la chimica a Demis Hassabis (e a David Baker e John M. Jumper, che però con gli scacchi non c’entrano nulla). Sette anni fa, Hassabis, ceo e co-fondatore di DeepMind, ormai nell’orbita Google, firmava col suo gruppo di ricerca il paper che spiegava l’umiliazione scacchistica inflitta da AlphaZero, la creatura artificiale di Hassabis, non all’intelligenza umana – quella aveva già perso la partita con l’IA vent’anni prima, quando Kasparov era stato battuto da Deep Blue, il supercomputer dell’Ibm – ma al motore scacchistico Stockfish, all’epoca il più forte. AlphaZero aveva impiegato non più di quattro ore per raggiungere il livello di Stockfish, ma lo aveva poi superato ampiamente: su cento partite, ne aveva vinte 28, persa nessuna e pattate tutte le altre.

Ma ci vuole un altro numero per stupire davvero: tra i due, il più potente in termini di puro calcolo, era Stockfish. Stockfish era in grado di analizzare la bellezza di 60 milioni di posizioni al secondo, AlphaZero solo 60.000 misere posizioni. Eppure, non c’era stata partita. La differenza stava nel metodo di autoapprendimento di AlphaZero, nelle reti neurali pensate come una simulazione del cervello umano. Reti che non si limitano ad applicare la forza bruta, cioè a procedere calcolando tutte le possibili varianti in una data posizione, e neppure selezionano l’area di calcolo sulla base di criteri predefiniti in sede di programmazione, ma lasciano che gli elementi di valutazione emergano dalla stessa pratica del gioco. Nel presentare il paper, Hassabis scriveva (riassumo): nell’ambito dell’IA, gli scacchi sono il gioco più studiato. Finora i programmi si sono basati su tecniche di ricerca e funzioni di valutazione affinate nel corso di decenni da équipe formate da ingegneri informatici assistiti da grandi maestri di scacchi.

AlphaZero no, AlphaZero conosce solo le regole del gioco. Nessuno ha immesso nulla nei suoi circuiti: nessuna istruzione, nessuna conoscenza previa. AlphaZero gioca, impara da sé, e da solo raggiunge in poche ore prestazioni superiori a quelle dell’uomo e di ogni altra intelligenza conosciuta. Negli scacchi come in molti altri domini. Tra questi altri domini ci saranno più tardi le proteine, per cui Hassabis ha ricevuto il Nobel e gli onori del mondo. Chapeau!

La partita: Stockfish 8 AlphaZero, Londra 2018

(Ecco una di quelle partite che fecero sgranare gli occhi, nel match di rivincita dominato, anche quello, da AlphaZero).

Con tre pedoni di vantaggio, Stockfish preferisce lasciare il pezzo in presa e gioca 25. Dd1. Cosa ha visto, ahilui troppo tardi?