La IA de DeepMind ha estado estableciendo récords y superando a los humanos en juegos complejos desde hace algún tiempo, pero ha encontrado su coincidencia en La venganza de Moctezuma.
En 2015, DeepMind intentó jugar varios juegos de Atari. La IA era competente en la mayoría de los juegos y llegó a ser tan buena en Video Pinball como un jugador humano.
DeepMind luchó notoriamente con la venganza de Montezuma, un juego notoriamente complejo de la década de 1980. La IA no pudo aprender un camino y recuperar incluso la primera "clave" del juego.
Los videojuegos, en general, se han convertido en un campo de batalla para que los AI se muestren. El fracaso de DeepMind con la venganza de Montezuma estableció el juego como un punto de referencia para la industria para demostrar los avances.
Un nuevo algoritmo diseñado por Fabio Zambetta y su equipo de la Universidad RMIT aprende de errores pasados e identifica los siguientes pasos 10 veces más rápido. La IA tuvo éxito en jugar de forma autónoma en la Venganza de Moctezuma.
En una declaración, Zambetta explicó:
“La inteligencia artificial verdaderamente inteligente debe poder aprender a completar tareas de forma autónoma en entornos ambiguos.
Hemos demostrado que el tipo correcto de algoritmos puede mejorar los resultados utilizando un enfoque más inteligente en lugar de puramente brutal forzando un problema de extremo a extremo en computadoras muy poderosas ".
Zambetta presentó sus hallazgos en la 33ª Conferencia de la AAAI sobre Inteligencia Artificial en Hawai hoy y explicó cómo funciona.
DeepMind y otras IA similares luchan con los juegos de aventura como Montezuma's Revenge debido a la falta de recompensa hasta que obtiene el primer objeto, una clave en este caso. Esto hace que sea difícil para la IA calcular si lo que está haciendo es correcto / óptimo.
Juegos como Video Pinball proporcionar a la AI recompensas rápidas debido a cosas tales como aumentos de puntos. Este enfoque le permite a la IA aprender qué camino va a lograr la puntuación más alta.
Al implementar el aprendizaje por refuerzo, los investigadores agregaron 'recompensas de pellets' para que el sistema lo promueva explorando más caminos.
"Con el tiempo, esta tecnología será valiosa para lograr objetivos en el mundo real, ya sea en autos que se manejan solos o como asistentes robóticos útiles con reconocimiento de lenguaje natural", dijo Zambetta.
Otros investigadores de IA continúan avanzando en sus enfoques. DeepMind mismo publicó dos artículos el verano pasado que describen cómo una IA podría aprender a conquistar la Venganza de Montezuma de los videos de YouTube.
Esperamos ver los próximos combates de IA para el título de La venganza de Montezuma.
¿Interesado en escuchar a los líderes de la industria discutir temas como este y sus casos de uso? Asista a los eventos coubicados de AI y Big Data Expo con los próximos espectáculos en Silicon Valley, Londres y Amsterdam para obtener más información. Coubicado con IoT Tech Expo, Blockchain Expo y Cyber Security & Cloud Expo.