x
1

AlphaZero



AlphaZero es un programa informático desarrollado por DeepMind, que utiliza el enfoque generalizado de AlphaGo Zero. El 5 de diciembre de 2017, el equipo de DeepMind lanzó una preimpresión presentando AlphaZero, que logró en 24 horas un nivel de juego sobrehumano en ajedrez, shogi y Go al derrotar a los campeones del mundo, Stockfish, Elmo y la versión de 3 días de AlphaGo Zero en cada caso. AlphaZero dominó a Stockfish después de solo 4 horas de autoaprendizaje, sin acceso a libros de apertura o base de datos de tablas de finales.[1][2][3]

AlphaZero (AZ) es una variante más generalizada del algoritmo AlphaGo Zero (AGZ), y es capaz de jugar shogi y ajedrez, así como Go. Las diferencias entre AZ y AGZ incluyen:

Al comparar las búsquedas de árbol de búsqueda Monte Carlo, AlphaZero busca solo 80,000 posiciones por segundo en ajedrez y 40,000 en shogi,[4]​ en comparación con 70 millones para Stockfish y 35 millones para Elmo. AlphaZero compensa el menor número de evaluaciones mediante el uso de su red neuronal profunda para centrarse mucho más selectivamente en la variación más prometedora.[1]

En los juegos de ajedrez de AlphaZero contra Stockfish, a cada programa se le dio un minuto de tiempo de reflexión por jugada. AlphaZero ganó 25 juegos como blanco, ganó 3 como negro y empató los 72 restantes.[1][5]​ En 2017, StockFish 8 era el campeón vigente del campeonato organizado por chess.com de ajedrez por computadora, con un ELO de 3400 puntos.[6]

En cien juegos de shogi contra Elmo, AlphaZero ganó noventa veces y perdió ocho veces.[1]

Después de 8 horas de autoaprendizaje de Go teniendo como contrincante a una versión previa de AlphaZero, AlphaZero ganó sesenta juegos y perdió cuarenta.[1]

En una versión actualizada de AlphaZero este venció a Stockfish 8 en un match de 1000 partidas, obteniendo un resultado de +155 -6 = 839.[7]​Calculando este resultado en elo, AlphaZero seria superior a Stockfish 8 en 53 puntos elo. La diferencia de elo es mucho menor de lo que parece y se explica por la gran cantidad de tablas en el match. (Alphazero obtuvo el 57.45% de los puntos vs 42.55% que obtuvo stockfish 8[8]​).



Escribe un comentario o lo que quieras sobre AlphaZero (directo, no tienes que registrarte)


Comentarios
(de más nuevos a más antiguos)


Aún no hay comentarios, ¡deja el primero!