I 13 possibili stati del nostro esempio di gioco Nim, rappresentati come 13 tazze, ognuna delle quali contiene carte piegate che rappresentano tutte le possibili mosse giocabili da quello stato di gioco.
Si potrebbe pensare che creare una propria intelligenza artificiale (IA) sia difficile o tecnico. Tuttavia, per alcuni compiti come la riproduzione di un semplice gioco, non è difficile costruire una propria intelligenza artificiale ad autoapprendimento. Inoltre, non è nemmeno necessario un computer o un dispositivo elettronico per farlo!
Un gioco semplice ma stimolante è il gioco per due giocatori chiamato Nim. In Nim, i segnalini sono disposti in almeno due pile. A ogni turno, un giocatore sceglie una pila e prende tutti i segnalini che vuole. Il giocatore che prende l’ultimo segnalino perde la partita. L’obiettivo del gioco, quindi, è costringere l’avversario a prendere l’ultimo segnalino.
Per esempio, supponiamo che il nostro gioco Nim abbia due pile, la pila A, contenente quattro segnalini, e la pila B, contenente tre segnalini. La partita può svolgersi in questo modo: Il giocatore 1, partendo per primo, prende un segnalino dalla pila A. Il giocatore 2 prende due segnalini dalla pila A. Il giocatore 1 prende tutti e tre i segnalini dalla pila B. Ora il giocatore 2 deve prendere l’ultimo segnalino rimasto dalla pila A, perdendo la partita.
È un’esperienza affascinante assistere a un ‘dispositivo’ che non conosce le strategie di un gioco e che alla fine impara dai propri errori fino a padroneggiare quel gioco
Per creare un’IA che giochi a Nim, è necessario innanzitutto capire tutti i suoi diversi stati possibili. Nel gioco descritto sopra, ci sono 13 stati diversi; quindi, abbiamo bisogno di 13 contenitori, ad esempio bicchieri di carta, ognuno dei quali rappresenta uno stato di gioco distinto. Ogni bicchiere conterrebbe tutte le possibili mosse legali che possono essere eseguite da quel particolare stato di gioco; queste possono essere rappresentate da pezzi di carta piegati, ognuno dei quali raffigura una mossa legale che può essere eseguita in quello stato di gioco.
Quando è il turno dell’IA di giocare, viene estratto a caso un foglio dalla tazza che rappresenta lo stato di gioco corrente e viene giocata la mossa raffigurata su quel pezzo di carta. Se l’IA vince, tutte le carte estratte vengono piegate e rimesse nelle rispettive tazze. Se invece l’IA perde, tutte le carte tranne quella che rappresenta l’ultima mossa vengono rimesse nella loro tazza. Tuttavia, se così facendo una carta rimane vuota, questa viene rimessa nella sua tazza e viene invece scartata quella che rappresenta la mossa precedente del gioco.
È un’esperienza affascinante vedere un “dispositivo” che non conosce le strategie di un gioco e che alla fine impara dai propri errori fino a padroneggiare quel gioco. Vi invito a creare la vostra IA e a sperimentare voi stessi questa esperienza!
Alexander Farrugia è docente di matematica presso l’University of Malta Junior College.
Morsi del suono
– Nel 2017 DeepMind, un laboratorio di ricerca sull’IA affiliato a Google, ha pubblicato un preprint che descrive AlphaZero, un’IA che impara le strategie di tre giochi (scacchi, Shogi e Go) giocando contro se stessa. Dopo essersi allenato per un massimo di 34 ore, AlphaZero è riuscito a battere completamente le migliori IA per ogni gioco in quel momento, rispettivamente Stockfish, Elmo e AlphaGo. Nel 2022 DeepMind ha rilasciato una nuova versione di AlphaZero che ha scoperto un modo più veloce per eseguire la moltiplicazione matriciale. Sempre nel 2022, DeepMind ha rilasciato un altro programma, muZero, che gioca contro se stesso per imparare a giocare a scacchi, Shogi, Go e ATARI 2600 senza conoscere le regole di nessuno di questi giochi!
Per ulteriori notizie sulla scienza, ascoltate Radio Mocha su .
LO SAPEVI?
– Il gioco del Nim è risolto, cioè la strategia migliore per ogni giocatore è nota per qualsiasi numero di pile e per qualsiasi numero di segnalini in ogni pila.
– Esistono diverse varianti di Nim. In una variante, il giocatore che prende l’ultimo segnalino vince la partita, invece di perderla. In un’altra variante, ogni giocatore deve prendere i segnalini dalla pila che contiene il maggior numero di segnalini in quel turno.
– Gli scacchi non sono un gioco risolto. Anche se la maggior parte degli esperti di scacchi concorda sul fatto che una partita di scacchi si concluderebbe con una patta se entrambi i giocatori giocassero la migliore mossa possibile a ogni turno, questo non è ancora stato dimostrato matematicamente. Tuttavia, gli scacchi sono risolti per posizioni con un massimo di sette pezzi.
– Le IA che giocano aiutano a scoprire innovazioni in altri campi dell’IA, in particolare quelli che utilizzano l’apprendimento per rinforzo, come l’elaborazione del linguaggio naturale e la robotica.
Per ulteriori curiosità, vedere .