AlphaGo

AlphaGo è un agente di intelligenza artificiale (AI) specializzato per giocare a Go, un gioco da tavolo di strategia cinese, contro concorrenti umani. AlphaGo è un progetto di Google DeepMind.

La capacità di creare un algoritmo di apprendimento in grado di battere un giocatore umano nei giochi strategici è una misura dello sviluppo dell'IA. AlphaGo è progettato come un'intelligenza artificiale autodidatta e gioca contro se stessa per padroneggiare il complesso gioco strategico di Go. Ci sono state versioni di AlphaGo che hanno battuto i giocatori umani, ma le nuove versioni sono ancora in fase di creazione.

Go è un gioco da tavolo cinese simile agli scacchi con due giocatori, uno che usa pezzi neri e uno bianco, posizionando un pezzo ogni turno. I pezzi vengono posizionati su una griglia di dimensioni variabili in base al livello di gioco fino a 19x19 punti di piazzamento. L'obiettivo è catturare più territorio (spazi vuoti) o pezzi nemici circondandoli con i tuoi pezzi. Solo le posizioni che sono orizzontali e verticali rispetto ai giocatori devono essere coperte per catturare; non è necessario che siano tutte diagonali. Entrambi i pezzi o il territorio possono essere catturati individualmente o in gruppi.

Gli scacchi possono essere un gioco da tavolo più famoso con pezzi bianchi e neri, ma Go ha un googol più mosse possibili. Il numero di posizioni possibili rende un approccio tradizionale di forza bruta, come è stato utilizzato con il Big Blue di IBM negli scacchi, impossibile con i computer attuali. Quella differenza di complessità del problema richiedeva un nuovo approccio.

AlphaGo si basa su un algoritmo di ricerca dell'albero di Monte Carlo basato sull'analisi di un elenco di possibili mosse dal suo repertorio appreso dalla macchina. Gli algoritmi e l'apprendimento differiscono tra le varie versioni di AlphaGo. AlphaGo Master, la versione che ha battuto Ke Jie, campione del mondo di Go, utilizza l'apprendimento supervisionato. AlphaGo Zero, la versione di apprendimento senza supervisione di AlphaGo, impara giocando contro se stesso. Innanzitutto, l'IA gioca in modo casuale, quindi con crescente raffinatezza. La sua maggiore raffinatezza è tale da battere costantemente la versione Master che domina i giocatori umani.

Guarda SciShow cover AlphaGo nel video qui sotto: