Mañana 21 de Febrero, los aficionados al juego del motor de Sony podremos disfrutar de un nuevo rival. Una Ai difícil de vencer. GT Sophy venció a los mejores jugadores del mundo en 2022 y ahora puedes competir contra ella.
El origen
En 2022, Sony AI y Polyphony Digital desarrollaron un nuevo agente de IA para competir en Gran Turismo a nivel mundial. En aquel entonces, el experimento fue descrito en un artículo en Nature, donde los investigadores demostraron que esta IA no solo era capaz de conducir muy rápido, algo que otras IA habían logrado en el pasado, sino que también aprendió tácticas, estrategias e incluso etiqueta de carrera.
Sin embargo, en aquel momento, GT Sophy, el nombre de la IA, aún no estaba completamente lista para su lanzamiento. A menudo pasaba a los oponentes en la primera oportunidad en una recta, permitiendo ser adelantada en la siguiente zona de frenado. Y a diferencia de los jugadores humanos, GT Sophy intentaba adelantar a los jugadores con penalizaciones de tiempo próximas, mientras que los humanos esperarían a que el coche penalizado se ralentizara para ganar posición.
Actualizaciones de GT Sophy
Durante el último año, Sony AI y Polyphony Digital han estado trabajando en GT Sophy, y a partir de mañana (21 de febrero), GT Sophy estará disponible en Gran Turismo 7 como parte de la actualización 1.29, al menos por un tiempo limitado. Hasta finales de marzo, los jugadores podrán poner a prueba sus habilidades en GT Sophy Race Together mode en una serie de carreras con niveles de dificultad crecientes. También habrá un partido uno contra uno en el que competirás contra Sophy en coches idénticos, para que puedas ver qué tan lento eres en comparación con la IA.
El presidente de Polyphony Digital, Kazunori Yamauchi, afirma que «esta evolución de la IA es un momento simbólico en los 25 años de historia de Gran Turismo, y es tan importante como la evolución de la simulación de la física automotriz, que está en el corazón y núcleo de un juego de carreras.»
Además, Yamauchi menciona que GT Sophy «conduce con continuidad en una gran variedad de situaciones, lo que permite a los usuarios disfrutar de la emoción de una batalla cercana como si estuvieran compitiendo contra un conductor de carreras profesional. Esta es una evolución importante incluso desde el punto de vista de la historia de los juegos de carreras. Seguiremos evolucionando a GT Sophy para hacer realidad nuestro concepto de «Race Together», donde prevemos proporcionar un oponente divertido para que los jugadores compitan y aprendan de él».
Aunque esta versión de Sophy será limitada en el juego, no será la última vez que veamos a la IA en acción. Sony afirma que recogerá comentarios sobre esta función inicial y los utilizará para mejorar la IA en futuras actualizaciones.
Cómo se entrenó el piloto de carreras de Gran Turismo
Este agente de carreras puede competir en igualdad de condiciones con los mejores jugadores humanos y puede superar al 80% de los humanos en carreras en línea. En el artículo, se describe el modelo de aprendizaje profundo utilizado para entrenar al agente. Pero en una segunda parte, se explica cómo se entrenó el agente, incluyendo los diferentes escenarios de entrenamiento utilizados.
Escenarios de entrenamiento
Aprender a correr requiere dominar una serie de habilidades: sobrevivir a una salida atestada, realizar adelantamientos tácticos en campo abierto y recorrer la pista en solitario con precisión. Para fomentar las habilidades básicas de carrera, colocamos al agente en escenarios con cero, uno, dos, tres o siete oponentes lanzados cerca (1v0, 1v1, 1v2, 1v3 y 1v7, respectivamente). Para crear variedad, crearon de forma aleatoria las posiciones de las pistas, las velocidades de salida, el espaciado entre coches y las políticas de los oponentes. Aprovechando el hecho de que el juego admite 20 coches a la vez para maximizar el uso de PlayStation lanzando más de un grupo a la pista.
Todos los escenarios básicos se ejecutaron durante 150 s. Además, para garantizar que el agente estuviera expuesto a situaciones que le permitieran aprender las habilidades destacadas por un asesor experto, utilizaron escenarios de tiempo o distancia limitados en secciones específicas del circuito. La figura 1 ilustra los escenarios de habilidad utilizados en Sarthe: salidas en parrilla de ocho coches, adelantamientos al rebufo 1v1 y dominio de la chicane final con poco tráfico. La siguiente figura muestra los escenarios especializados utilizados para preparar al agente para competir en Seaside y Maggiore.
Para aprender a evitar resultados catastróficos en la pista de alta velocidad de Sarthe, también incorporaron el aprendizaje de errores. A diferencia del entrenamiento curricular, en el que las habilidades iniciales son suplantadas por otras posteriores o en el que las habilidades se superponen unas a otras en una sucesión jerárquica, sus escenarios de entrenamiento son complementarios y se entrenaron en una única política de control para las carreras.
Durante el entrenamiento, el instructor asignó nuevos escenarios a cada trabajador seleccionado del conjunto configurado para esa pista sobre la base de proporciones ajustadas a mano diseñadas para proporcionar una cobertura de habilidades suficiente.
- [con]Neurona #26 - 18 de diciembre de 2023
- [con]Neurona #25 - 10 de diciembre de 2023
- [con]Neurona #24 - 2 de diciembre de 2023