Dentro de la startup que aspira a dar un salto de gigante en la inteligencia robótica

Un robot impulsado por la IA de Physical Intelligence dobla la ropa

Inteligencia física

En San Francisco, dentro de un almacén revestido con relucientes paneles de acero, me entregan una taza de café recién hecho hecho íntegramente por un robot. Este hecho por sí solo no es impresionante (los robots han estado preparando café durante más de una década), pero el cerebro robótico que hizo este café no es un pony de un solo truco. También ha aprendido a realizar muchas otras tareas, como doblar ropa, pelar verduras y limpiar cocinas, en una época en la que la mayoría de los niños pequeños apenas aprenden a caminar.

Physical Intelligence, una empresa emergente fundada en 2024, apuesta a que un cerebro de robot que pueda aprender a realizar muchas tareas diferentes permitirá, en un futuro no muy lejano, que los robots se involucren en nuestra vida diaria. En lugar de centrarse en una sola máquina, como los robots humanoides construidos por Tesla o Boston Dynamics o los robots industriales utilizados por Amazon, la empresa quiere construir un sistema de control adaptable que pueda realizar muchas tareas con muchas máquinas diferentes.

Una inteligencia robótica de propósito general no es una idea nueva: muchos expertos en robótica dirían que ha sido un objetivo a largo plazo durante décadas. Pero, así como a principios de la década de 2020 se produjo un florecimiento de los grandes modelos de lenguaje (LLM) que impulsan los chatbots de IA gracias a la combinación correcta de potencia informática, datos y avances algorítmicos, Physical Intelligence espera evocar un salto de progreso similar en la robótica en general.

“En la mayoría de los ámbitos, resolver más problemas sólo hace las cosas más difíciles, pero en la IA, en realidad lo hace más fácil, porque entonces tienes fuentes de conocimiento más diversas de las cuales aprender”, dice Sergey Levine de la Universidad de California, Berkeley, uno de los fundadores de la empresa.

El éxito de los LLM ha llevado a un nuevo tipo de IA robótica, llamado modelo visión-lenguaje-acción (VLA), que sustenta gran parte de la investigación de Inteligencia Física. En lugar de enseñarle a un robot una habilidad a la vez, un VLA utiliza el amplio conocimiento de un LLM para traducir solicitudes generales en acciones específicas, lo que permite a los robots seguir instrucciones y realizar muchas tareas diferentes. “[VLAs] “Son probablemente la traducción más directa del entusiasmo que sentimos por los grandes modelos lingüísticos”, afirma Ingmar Posner, de la Universidad de Oxford. En lugar de predecir la siguiente palabra, estos sistemas predicen el siguiente movimiento robótico necesario para completar una tarea concreta, afirma.

Un gran desafío para el entrenamiento de robots es que existe un número casi infinito de variaciones del mundo real para cualquier tarea y muy pocos datos para que los robots aprendan. Automatizar el aprendizaje (enseñar a los robots a aprender por sí mismos) es una posible solución, pero la mayoría de los desarrolladores de robots han evitado hacerlo porque recopilar suficientes datos es una tarea difícil, dice Levine. “Aunque, en principio, debería ser automático, en la práctica, la cantidad de trabajo necesaria para obtener los datos para una aplicación particular era mayor que el trabajo necesario para hacerlo todo a mano”.

Levine y sus colegas esperan que, gracias a los VLA, necesitarán muchos menos datos para tener éxito. Debajo de la sala de juntas donde hablé con Levine, una flota de empleados enseñaba a los robots a realizar lo que parecía ser una serie de tareas banales: doblar camisas, colocar almohadas en los estantes, cortar lazos en cajas de regalos. A la vuelta de la esquina, me enteré, había dos almacenes que contenían supermercados, dormitorios y cocinas falsos, que se renovaban cada semana, donde los robots y los modelos de inteligencia artificial de Inteligencia Física podían aprender a enfrentarse a una variedad de entornos. La compañía también estaba implementando sus robots en hogares reales para probar cómo podrían hacer frente al desorden del mundo real.

Edificio de Inteligencia Física en San Francisco

ALEX WILKINS

Esta variedad es uno de los ingredientes clave que ha llevado a una sorprendente cantidad de progreso, incluido el aprendizaje de robots para generalizar más allá de tareas que han visto antes. Un modelo reciente, llamado π0.7, pudo cocinar batatas en una freidora con instrucciones verbales paso a paso de un humano, a pesar de nunca haber usado una freidora antes.

La velocidad del progreso en los dos años que lleva funcionando Inteligencia Física ha sorprendido a Levine. “En realidad, ha ido bastante más rápido de lo que pensábamos”, afirma.

Otras empresas se están dando cuenta. Un montón de empresas emergentes con miles de millones de dólares en financiación, así como empresas más establecidas, como Amazon y Google DeepMind, están intentando desarrollar sus propios robots de uso general.

A pesar de los rápidos avances hasta ahora, es difícil predecir qué tan rápido avanzará el campo. El progreso de las empresas de inteligencia artificial como OpenAI y Anthropic ha sido rápido, pero el avance suele ser más lento para las empresas de robótica. Todo investigador de robótica estará familiarizado con la paradoja de Moravec: el científico informático Hans Moravec observó en 1988 que es fácil para los robots dominar juegos como el ajedrez o obtener altas puntuaciones en pruebas de coeficiente intelectual, pero es “difícil o imposible darles las habilidades de un niño de un año en lo que respecta a percepción y movilidad”.

Todavía no está claro cuántos datos necesitará la Inteligencia Física para preparar sus robots para su uso en el mundo real, afirma Posner. “Yo diría que en este momento estamos viendo las primeras señales de que algo interesante podría estar sucediendo, pero si ese es realmente el camino a seguir es una cuestión diferente”.

Él cree que el éxito en el mundo real aún está muy lejos, en parte porque los usuarios llevarán a los robots al límite. “Los humanos son adversarios. Les gusta jugar con un robot, al menos, porque es divertido”, dice Posner. “¿Creo que estas cosas se implementarán a gran escala en el corto plazo, con un modelo de negocio que realmente genere dinero? No, definitivamente no. Me resultaría muy difícil de creer”.

Temas: