cerca

Con AlphaGo l’intelligenza artificiale prova a trovare forme nuove di conoscenza

Il ceo di DeepMind, Demis Hassabis, ritiene che la capacità di incamerare dati e rielaborarli del software possa essere applicata potenzialmente a tutti i settori della conoscenza

26 Novembre 2017 alle 06:07

Con AlphaGo l’intelligenza artificiale prova a trovare forme nuove di conoscenza

Foto LaPresse

Quando il gioco si fa duro quelli di DeepMind iniziano a giocare. La sussidiaria di Alphabet specializzata nel ramo dell’intelligenza artificiale investe da anni ingenti risorse nel campo dei giochi di strategia con un duplice obiettivo. Se da un lato il gioco rappresenta infatti un prezioso viatico per insegnare alle macchine a “pensare” come gli esseri umani, d’altro canto esso rappresenta una possibilità per iniziare a capire come ragionare le macchine. Il gioco giapponese del go è considerato da tempo un’ottima fucina per lo sviluppo di software basati sull’intelligenza artificiale. Originario della Cina, dove è nato ben tremila anni fa, il go spopola in Asia ma negli ultimi tempi è sbarcato anche in occidente. Due giocatori si affrontano muovendo alternativamente pedine nere e bianche su una scacchiera (goban) composta da un reticolo 19 x 19. Lo scopo è controllare una zona di goban maggiore rispetto a quella dell’avversario. Un proverbio coreano recita che nessuna partita di go è mai stata giocata due volte, eventualità verosimile dal momento che esiste un numero di combinazioni di gran lunga maggiore degli atomi presenti nel nostro universo.

 

La storia di AlphaGo, il software elaborato da DeepMind per competere ad alto livello, inizia nel 2015. Nel primo match ufficiale disputato contro il pluricampione europeo della disciplina Fan Hui, AlphaGo vinse cinque a zero. Era la prima volta che un computer batteva un giocatore professionista. Nel match disputato l’anno successivo, AlphaGo giocò una serie di mosse talmente inedite da rimettere in discussione centinaia di anni di strategia. Lo scorso gennaio DeepMind rivelò che dietro al nickname ‘Master’ – misterioso giocatore protagonista di una striscia di sessanta vittorie consecutive – c’era appunto AlphaGo.

 

Il meglio però doveva ancora venire. Fino a quel momento il software era riuscito a raggiungere livelli di abilità tali da fargli battere giocatori del calibro di Lee Sedol, diciotto volte campione del mondo, grazie a una lunga “gavetta” di incontri disputati con esseri umani. Il suo successore, AlphaGo Zero, è invece capace di imparare il gioco senza che prima gli venga fornita alcuna conoscenza preliminare (from scratch) e si allena semplicemente sfidando sé stesso. Dopo tre soli giorni, AlphaGo Zero è riuscito a superare in abilità il programma che ha battuto Sedol, dopo ventuno giorni a uguagliare Master e al quarantesimo giorno ha superato tutte le precedenti versioni di AlphaGo, diventando il miglior giocatore di go al mondo. Il tutto – ci tengono a precisare a DeepMind – senza alcun intervento umano e senza avere a disposizione la minima base dati.

 

Com’è stato possibile polverizzare migliaia di anni di conoscenze nell’arco di un periodo così limitato? La risposta è un mix tra biologia e ingegneria informatica. L’apprendimento per rinforzo è una tecnica mutuata dalla psicologia comportamentale e mira a realizzare algoritmi capaci di apprendere e adattarsi alle mutazioni dell’ambiente. Se l’agente (in questo caso AlphaGo Zero) realizza il suo obiettivo, nel caso specifico vincere una partita, viene ricompensato con un punteggio positivo, diversamente viene penalizzato. Un meccanismo simile a quello del cane che durante l’addestramento viene premiato con la crocchetta. Il risultato è amplificato dall’utilizzo di reti neurali, modelli matematici progettati per mimare il funzionamento dei neuroni umani.

 

Algoritmi per problemi complessi

Il ceo di DeepMind, Demis Hassabis, ritiene che questa modalità possa essere applicata potenzialmente a tutti i settori della conoscenza. “Vogliamo sfruttare algoritmi come questo per risolvere problemi complessi del mondo reale come il ripiegamento delle proteine o la progettazione di nuovi materiali”, ha detto.

 

Braden Allenby, docente di ingegneria ambientale presso l’Arizona State University ed esperto di tecnologia, dice al Foglio che “il vertiginoso incremento delle capacità cognitive ottenuto negli ultimi anni suggerisce che l’intelligenza artificiale possa trovarsi in una fase di decollo, dove i miglioramenti graduali lasciano spazio a progressi rapidi, imprevedibili e poderosi”. “AlphaGo Zero – conlcude Allenby – indica anche che l’intelligenza artificiale non è semplicemente l’amplificazione di capacità cognitive umane, ma uno strumento che potrebbe condurre verso una forma di conoscenza totalmente originale”.

Lascia il tuo commento

Condividi le tue opinioni su Il Foglio

Caratteri rimanenti: 1000

Commenti all'articolo

  • Nambikwara

    Nambikwara

    26 Novembre 2017 - 11:11

    E alla fine ("ripartendo da zero" cioè from scratch) fra qualche anno, un Alpha Go 6 produrrà "una forma di conoscenza totalmente originale": cioè totalmente originale che si differenzierà dalle forme di conoscenza umana. Da li cominceranno 2 "mondi" o culture diversi. Sarà interessante come sostituiranno (gli Alfa go 6 e successivi) il detto americano "Play the game" (gioca il gioco, ovvero "stai" al gioco); in italiano non abbiamo una parola per il gioco con regole (game) e una per il gioco senza regole (play) dal significato astratto (giocare, suonare,....).Quando il "gioco", si farà duro allora ne vedremo delle belle. Ricordo, avevo 6-7 anni e leggendo un "Romanzo di Urania", che l'autore faceva comunicare, anche in termini di "sentimenti", tra loro due computer distanti migliaia di km. e mettendo insieme le loro forze tentavano sfracelli su gli umani. Quando il futuro era già ieri, pardon l'altro ieri.

    Report

    Rispondi

  • Giovanni

    26 Novembre 2017 - 09:09

    In pratica si va verso un nuovo essere raziocinante totalmente cibernetico. E oggi ancora siamo precipuamente legati alla matematica binaria ma ben presto si supererà questo limite e allora...

    Report

    Rispondi

Servizi