63rojlq4vnqk3rda5vl1mys1i5xvcgu8 Augvwqy5ozctvsm E4yx8rr4 Dlulqitmmht6qx3p9shutpguhy 4sa64rdemghvk0edkt6fqh6 P3d4aw1200 H630 N Nu.jpeg

Investigación

Publicado
Autores

Equipo de robótica

Dos nuevos sistemas de IA, ALOHA Unleashed y DemoStart, ayudan a los robots a aprender a realizar tareas complejas que requieren movimientos diestros.

Las personas realizan muchas tareas a diario, como atarse los cordones de los zapatos o apretar un tornillo. Pero para los robots, aprender a realizar estas tareas que requieren mucha destreza es increíblemente difícil. Para que los robots sean más útiles en la vida de las personas, necesitan mejorar su capacidad para hacer contacto con objetos físicos en entornos dinámicos.

Hoy presentamos dos nuevos artículos que presentan nuestros últimos avances en inteligencia artificial (IA) en la investigación de la destreza robótica: ALOHA desatada que ayuda a los robots a aprender a realizar tareas de manipulación con dos brazos complejas y novedosas; y DemostraciónInicio que utiliza simulaciones para mejorar el rendimiento en el mundo real de una mano robótica de varios dedos.

Al ayudar a los robots a aprender de las demostraciones humanas y traducir las imágenes en acciones, estos sistemas están allanando el camino para robots que pueden realizar una amplia variedad de tareas útiles.

Mejorando el aprendizaje por imitación con dos brazos robóticos

Hasta ahora, la mayoría de los robots de IA más avanzados solo podían recoger y colocar objetos usando un solo brazo. Nuestro nuevo papelPresentamos ALOHA Unleashed, que consigue un alto nivel de destreza en la manipulación bi-arm. Con este nuevo método, nuestro robot aprendió a atarse un cordón, colgar una camisa, reparar otro robot, insertar un engranaje e incluso limpiar una cocina.

Ejemplo de un robot de dos brazos que endereza los cordones de los zapatos y los ata formando un moño.

Ejemplo de un robot de dos brazos que coloca una camiseta polo sobre una mesa, la coloca en una percha y luego la cuelga en un estante.

Ejemplo de un robot de dos brazos reparando otro robot.

El método ALOHA Unleashed se basa en nuestro ALOHA 2 Plataforma que se basó en el original ALOHA (un sistema de hardware de código abierto de bajo costo para teleoperación bimanual) de Universidad de Stanford.

ALOHA 2 es significativamente más diestro que los sistemas anteriores porque tiene dos manos que pueden teleoperarse fácilmente para fines de entrenamiento y recopilación de datos, y permite que los robots aprendan a realizar nuevas tareas con menos demostraciones.

También hemos mejorado la ergonomía del hardware robótico y mejorado el proceso de aprendizaje en nuestro último sistema. Primero, recopilamos datos de demostración al operar de forma remota el comportamiento del robot, realizando tareas difíciles como atarse los cordones de los zapatos y colgar camisetas. A continuación, aplicamos un método de difusión, prediciendo las acciones del robot a partir del ruido aleatorio, de forma similar a cómo lo hacía nuestro robot. Imagen El modelo genera imágenes. Esto ayuda al robot a aprender de los datos, de modo que pueda realizar las mismas tareas por sí solo.

Aprendiendo comportamientos robóticos a partir de algunas demostraciones simuladas

Controlar una mano robótica diestra es una tarea compleja, que se vuelve aún más compleja con cada dedo, articulación y sensor adicional. nuevo papelPresentamos DemoStart, que utiliza un algoritmo de aprendizaje por refuerzo para ayudar a los robots a adquirir conductas hábiles en la simulación. Estas conductas aprendidas son especialmente útiles para realizaciones complejas, como manos con varios dedos.

DemoStart primero aprende de estados fáciles y, con el tiempo, comienza a aprender de estados más difíciles hasta que domina una tarea al máximo de su capacidad. Requiere 100 veces menos demostraciones simuladas para aprender a resolver una tarea en simulación que lo que se necesita normalmente cuando se aprende de ejemplos del mundo real para el mismo propósito.

El robot logró una tasa de éxito de más del 98 % en una serie de tareas diferentes en la simulación, incluyendo la reorientación de cubos con un color determinado, el ajuste de una tuerca y un tornillo y el orden de las herramientas. En la configuración del mundo real, logró una tasa de éxito del 97 % en la reorientación y el levantamiento de cubos, y del 64 % en una tarea de inserción de enchufes que requería una gran coordinación y precisión de los dedos.

Ejemplo de un brazo robótico que aprende a insertar con éxito un engranaje amarillo en una simulación (izquierda) y en una configuración del mundo real (derecha).

Ejemplo de un brazo robótico que aprende a apretar un tornillo en una simulación.

Desarrollamos DemoStart con MuJoConuestro simulador de física de código abierto. Después de dominar una variedad de tareas de simulación y usar técnicas estándar para reducir la brecha entre simulación y realidad, como la aleatorización de dominios, nuestro enfoque pudo transferir casi cero disparos al mundo físico.

El aprendizaje robótico en simulación puede reducir el costo y el tiempo necesarios para ejecutar experimentos físicos reales. Pero es difícil diseñar estas simulaciones y, además, no siempre se traducen con éxito en un rendimiento en el mundo real. Al combinar el aprendizaje de refuerzo con el aprendizaje a partir de algunas demostraciones, el aprendizaje progresivo de DemoStart genera automáticamente un plan de estudios que cierra la brecha entre la simulación y la realidad, lo que facilita la transferencia de conocimientos de una simulación a un robot físico y reduce el costo y el tiempo necesarios para ejecutar experimentos físicos.

Para permitir un aprendizaje robótico más avanzado a través de una experimentación intensiva, probamos este nuevo enfoque en una mano robótica de tres dedos, llamada DEX-EEque fue desarrollado en colaboración con Robot de sombra.

Imagen de la mano robótica diestra DEX-EE, desarrollada por Shadow Robot, en colaboración con el equipo de robótica de Google DeepMind (Crédito: Shadow Robot).

El futuro de la destreza robótica

La robótica es un área única de investigación en IA que muestra lo bien que funcionan nuestros métodos en el mundo real. Por ejemplo, un modelo de lenguaje de gran tamaño podría decirte cómo apretar un tornillo o atarte los zapatos, pero incluso si estuviera incorporado en un robot, no sería capaz de realizar esas tareas por sí solo.

Algún día, los robots con inteligencia artificial ayudarán a las personas con todo tipo de tareas en el hogar, en el lugar de trabajo y más. La investigación sobre destreza, incluidos los enfoques de aprendizaje eficientes y generales que hemos descrito hoy, ayudarán a hacer posible ese futuro.

Todavía tenemos un largo camino por recorrer antes de que los robots puedan agarrar y manipular objetos con la facilidad y precisión de las personas, pero estamos logrando avances significativos y cada innovación revolucionaria es otro paso en la dirección correcta.