Screenshot 2024 03 06 At 8.11.22 Pm.png

La manipulación robótica siempre ha presentado un desafío importante en los campos de la automatización y la inteligencia artificial, particularmente cuando se trata de tareas que requieren un alto grado de destreza. Los métodos tradicionales de aprendizaje por imitación, que se basan en demostraciones humanas para enseñar a los robots tareas complejas, se han visto limitados por la necesidad de disponer de datos de demostración extensos y de alta calidad. Debido a las complejidades involucradas, este requisito a menudo se traduce en un esfuerzo humano considerable, especialmente para tareas de manipulación diestra con varios dedos.

https://arxiv.org/abs/2402.14795

En este contexto, este artículo presenta un marco novedoso, Demostración cibernética (Figura 2), que utiliza demostraciones humanas simuladas para tareas de manipulación de robots del mundo real. Este enfoque no solo mitiga la necesidad de hardware físico, permitiendo así la recopilación de datos remota y paralela, sino que también mejora significativamente el rendimiento de las tareas a través de técnicas de aumento de datos exclusivas del simulador (que se muestran en la Figura 3). Al aprovechar estas técnicas, CyberDemo puede generar un conjunto de datos de órdenes de magnitud mayores que los que podrían recopilarse en entornos del mundo real. Esta capacidad aborda uno de los desafíos fundamentales en el campo: la transferencia sim2real, donde las políticas entrenadas en simulación se adaptan para su aplicación en el mundo real.

La metodología de CyberDemo comienza con la recopilación de demostraciones humanas mediante teleoperación en un entorno simulado utilizando dispositivos de bajo coste. Luego, estos datos se enriquecen mediante un amplio aumento para incluir una amplia gama de condiciones visuales y físicas que no estuvieron presentes durante la recopilación de datos inicial. Este proceso está diseñado para mejorar la solidez de la política entrenada frente a las variaciones en el mundo real. El marco emplea una estrategia de aprendizaje curricular para la capacitación en políticas, comenzando con el conjunto de datos aumentado e introduciendo gradualmente demostraciones del mundo real para afinar la política. Este enfoque garantiza una transición fluida entre simulación y realidad, abordando variaciones en la iluminación, la geometría del objeto y la pose inicial sin necesidad de demostraciones adicionales.

La eficacia de CyberDemo queda subrayada por su desempeño (Figura 4) en diversas tareas de manipulación. En comparación con los métodos tradicionales, CyberDemo demuestra una mejora notable en las tasas de éxito de las tareas. Específicamente, CyberDemo logra una tasa de éxito que es 35% mayor para tareas casi estáticas como recoger y colocar y 20% mayor para tareas no cuasiestáticas como girar una válvula en comparación con políticas previamente capacitadas y ajustadas en demostraciones del mundo real. Además, en pruebas con objetos invisibles, destaca especialmente la capacidad de generalización de CyberDemo, con una tasa de éxito de 42,5% en la rotación de objetos novedosos, un salto significativo con respecto al rendimiento de los métodos convencionales.

Este método se evalúa en comparación con varias líneas de base, incluidos modelos de preentrenamiento de visión de última generación como PVR, MVP y R3M, que se han empleado anteriormente para tareas de manipulación robótica. PVR se basa en MoCo-v2 con una red troncal ResNet50, MVP utiliza aprendizaje autosupervisado desde un codificador automático enmascarado con una red troncal Vision Transformer y R3M combina aprendizaje de contraste de tiempo, alineación de lenguaje de video y regularización L1 con una red troncal ResNet50. El éxito de CyberDemo frente a estos modelos bien establecidos destaca su eficiencia y solidez y su capacidad para superar a los modelos que han sido ajustados en conjuntos de datos de demostración del mundo real.

En conclusión, el enfoque innovador de CyberDemo, que aprovecha los datos de simulación aumentados, desafía la creencia predominante de que las demostraciones del mundo real son fundamentales para resolver problemas del mundo real. La evidencia empírica presentada a través del desempeño de CyberDemo demuestra el potencial sin explotar de los datos de simulación, mejorados mediante el aumento de datos, para superar los datos del mundo real en términos de valor para tareas de manipulación robótica. Si bien la necesidad de diseñar entornos simulados para cada tarea presenta una capa adicional de esfuerzo, reducir la intervención humana requerida para la recopilación de datos y evitar procesos complejos de diseño de recompensas ofrece ventajas sustanciales. CyberDemo representa un importante paso adelante en el campo de la manipulación robótica, ofreciendo una solución escalable y eficiente a los desafíos perennes de la transferencia sim2real y la generalización de políticas.


Revisar la Papel y Proyecto. Todo el crédito por esta investigación va a los investigadores de este proyecto. Además, no olvides seguirnos en Gorjeo y noticias de Google. Unirse nuestro SubReddit de 38k+ ML, 41k+ comunidad de Facebook, Canal de discordiay LinkedIn Grarriba.

Si te gusta nuestro trabajo, te encantará nuestro Boletin informativo..

No olvides unirte a nuestro Canal de telegramas

También te puede gustar nuestro Cursos GRATUITOS de IA….


Vineet Kumar es pasante de consultoría en MarktechPost. Actualmente está cursando su licenciatura en el Instituto Indio de Tecnología (IIT), Kanpur. Es un entusiasta del aprendizaje automático. Le apasiona la investigación y los últimos avances en Deep Learning, Computer Vision y campos relacionados.