Los robots de fútbol han tenido una actualización. Los robots de dos piernas entrenados mediante aprendizaje por refuerzo profundo, impulsado por inteligencia artificial, pueden caminar, girar para patear una pelota y levantarse después de caer más rápido que los robots que trabajan con lecciones escritas.
chico palanca en Google DeepMind y sus colegas pusieron baterías Robotis OP3 robotsque miden unos 50 centímetros de alto y tienen 20 articulaciones, a través de 240 horas de aprendizaje por refuerzo profundo.
Esta técnica combina dos principios clave del entrenamiento de IA: el aprendizaje por refuerzo permite a los agentes adquirir habilidades mediante prueba y error, con el objetivo de ser recompensados por elegir correctamente con más frecuencia que por elegir incorrectamente, mientras que el aprendizaje profundo utiliza capas de redes neuronales (intenta imitar al ser humano). cerebro: para analizar patrones dentro de los datos que se muestran a la IA.
Los investigadores compararon sus robots con robots que funcionan con habilidades preestablecidas. Los entrenados con aprendizaje de refuerzo profundo podían caminar un 181 por ciento más rápido, girar un 302 por ciento más rápido, patear una pelota un 34 por ciento más fuerte y levantarse un 63 por ciento más rápido después de caer en un juego uno contra uno que los demás. «Estos comportamientos son muy difíciles de diseñar y programar manualmente», dice Lever.
La investigación hace avanzar el campo de la robótica, dice Jonathan Aitken en la Universidad de Sheffield, Reino Unido. «Uno de los problemas más importantes que se abordan en este documento es cerrar la brecha entre lo simulado y lo real», afirma. Aquí es donde las habilidades aprendidas en simulaciones no necesariamente se transfieren bien a entornos de la vida real.
La solución propuesta por el equipo de Google DeepMind (usar un motor de física para simular casos de entrenamiento en lugar de que el robot pruebe repetidamente cosas en la vida real y usarlas como datos de entrenamiento analizados por la red neuronal) es útil, afirma.
Pero «los robots que juegan fútbol no son el objetivo final», dice un miembro del equipo Tuomas Haarnoja.
«El objetivo de este trabajo no es producir robots humanoides que jueguen en la Premier League en el corto plazo», dice Aitken, «sino comprender cómo podemos desarrollar rápidamente habilidades robóticas complejas, utilizando metodologías de entrenamiento sintéticas para desarrollar habilidades que puedan ser transferidos de forma rápida y, lo que es más importante, de forma sólida a aplicaciones de trabajo reales”.
Temas: