En cuatro horas, una máquina aprendió sola a jugar ajedrez

En cuatro horas, una máquina aprendió sola a jugar ajedrez

Solo con conocer las reglas del juego, un sistema de aprendizaje automático se convirtió en experto.

En cuatro horas, una máquina aprendió solaa jugar ajedrez

El modelo de aprendizaje automático desarrollado por DeepMind venció al programa reconocido como campeón mundial.

Foto:

Jaime Moreno / EL TIEMPO

07 de diciembre 2017 , 11:18 p.m.

DeepMind, la división de investigaciones en inteligencia artificial de Google, presentó un nuevo avance en su algoritmo de machine learning, que le permitió a una máquina aprender a jugar ajedrez en tan solo cuatro horas y sin instrucción humana.
Meses atrás, AlphaGo Zero fue reconocida como la máquina que aprendió sola a dominar el Go, milenario juego chino. Luego de jugar contra sí misma por horas, dedujo estrategias que la consolidaron como la campeona imbatible en esa disciplina.

Ahora, un artículo publicado por la Biblioteca de la Universidad de Cornell recoge los resultados de la reutilización de ese modelo de machine learning (denominado AlphaZero) en otras disciplinas.

Bastó alimentar en el sistema las reglas del juego para que en solo cuatro horas este lograra vencer en un ‘torneo’ de cien juegos a Stockfish 8, el programa de ajedrez que, hasta ahora, era considerado el campeón del mundo.

Según reporta The Guardian, el artículo académico reza: “AlphaZero logró en 24 horas un nivel de juego sobrehumano en los juegos de ajedrez y shogi, así como Go, y derrotó a un programa campeón mundial en cada caso de forma convincente”. Entre los autores del texto se cuenta a Demis Hassabis, fundador de DeepMind.

El machine learning es un área de las ciencias de la computación y la inteligencia artificial. Su meta es usar una gran capacidad computacional para recibir millones de datos, crear correlaciones y analizarlos en un tiempo mucho menor que el que le tomaría a una mente humana. En otras palabras, se ocupa de cómo aprenden las máquinas.

Tradicionalmente, las máquinas deben ser entrenadas por seres humanos y alimentadas con datos. Deep Blue, de IBM, por ejemplo, tuvo que observar miles de partidas humanas de jugadores de ajedrez expertos y aprender de ellos para poder vencer al maestro ruso Gary Kasparov en 1997.

Pero, a diferencia de otros sistemas, AlphaZero aprende sin observar a otros. Tal y como lo hizo con Go, analiza partidas que emula contra sí mismo para crear estrategias y optimizar su rendimiento.

TECNOLOGÍA

Sigue bajando para encontrar más contenido

Ya leíste 20 artículos gratis este mes

Rompe los límites.

Aprovecha nuestro contenido
desde $10.999 al mes.

¿Ya eres suscriptor? Ingresa

Sabemos que te gusta estar siempre informado.

Crea una cuenta gratis y pódras disfrutar de:

  • Acceso ilimitado al contenido desde cualquier dispositivo.
  • Acceso a boletines con las mejores noticias de actualidad.
  • Comentar las noticias que te interesan.
  • Guardar tus artículos favoritos.

Crea una cuenta gratis y disfruta de acceso ilimitado al contenido, desde tu computador, tableta o teléfono inteligente.

Disfruta del contenido sin límites

CREA UNA CUENTA GRATIS


¿Ya tienes cuenta? INGRESA