El agente, bautizado como GT Sophy, demostró que puede alcanzar altas velocidades, mantener el control del vehículo y, al mismo tiempo, respetar las normas de comportamiento en carrera en sus enfrentamientos con los mejores conductores de e-sports del mundo.
El equipo de expertos de Sony IA, liderados por Peter Wurman, destaca que este avance podría ser útil para otras aplicaciones de navegación autónoma, así como para mejorar otras investigaciones sobre inteligencia artificial.
Recuerdan que un gran número de aplicaciones de IA dependen de las decisiones que se toman en tiempo real en sistemas físicos mientras interactúan con humanos.
Lea más: Portugal recupera la normalidad tras ciberataque a Vodafone que sacudió país
En este sentido, las carreras de coches reproducen a la perfección esas condiciones, ya que los pilotos deben ejecutar complejas maniobras tácticas para adelantar a otro coche o para bloquear el avance de sus rivales, al tiempo que llevan las máquinas hasta los límites de su tracción.
Wurman y sus colegas enseñaron a GT Sophy a jugar al Gran Turismo a través del aprendizaje de refuerzo profundo, de manera que el agente llegó a dominar la técnica de aceleración y frenado eficiente en diferentes circuitos de carreras.
También aprendió a buscar rutas alternativas cuando se le presentaban escenarios diferentes o se veía obstaculizado por un rival.
No obstante, una de las mayores dificultades que encuentran los desarrolladores de agentes de IA es la enseñanza de normas de comportamiento para garantizar que éste evite penalizaciones vinculadas a infracciones de unas reglas dictadas por jueces humanos.
No obstante, GT Sophy fue capaz de ganar carreras contra los cuatro mejores jugadores de Gran Turismo en varias combinaciones de circuitos y con tres coches diferentes, los cuales pueden alcanzar velocidades de más de 300 kilómetros por hora.
"Al describir cómo entrenamos a conductores de nivel competitivo, demostramos las posibilidades y desafíos que plantea el uso de estas técnicas para controlar sistemas dinámicos complejos en contextos en los que los agentes deben respetar normas humanas definidas de manera imprecisa", escriben los autores en el estudio, en referencia, por ejemplo, a la robótica, los drones o los vehículos autónomos.
Asimismo, celebran, estos avances pueden mejorar la experiencia de los jugadores de e-sports y servir como una herramienta de entrenamiento realista para pilotos profesionales.