IA física: qué es y qué no es

La IA física es la.

NVIDIA habla de ello, las consultoras hablan de ello y también los inversores y las startups de robótica. Todos hablan de IA física. De repente, el término está en todas partes.

Pero ¿qué es exactamente la IA física? Y lo que es igualmente importante, ¿qué no lo es?

En esta publicación, desmitifiquemos el término. No solo explicaremos el concepto en sí, sino que también intentaremos separarlo de términos cercanos con los que a menudo se confunde: modelos mundiales, IA incorporada, IA física y gemelos digitales.

1. ¿Qué es la IA física?

Una definición práctica que encuentro útil es esta [1]:

La IA física es una IA que cierra el círculo entre la percepción y la acción en el mundo físico real.

La mayoría de las IA actuales viven en pantallas. Realizan tareas como clasificar imágenes, resumir documentos, redactar correos electrónicos o recomendar qué película ver a continuación. Todas ellas son obras ciertamente útiles, pero todas suceden en el mundo digital.

Una IA física es diferente a eso. Se sale del mundo digital y de hecho interactúa con el mundo real. Capta lo que sucede a su alrededor a través de sensores, determina lo que hay que hacer y finalmente lo hace. La acción podría lograrse a través de un brazo robótico, un humanoide, un dron, un automóvil autónomo o una máquina industrial en una fábrica.

El resultado de la IA física ya no es solo texto en una pantalla; es un movimiento real en el mundo.

Piense en tomar una taza. Un chatbot que simplemente explica cómo hacerlo no es IA física. Pero un robot que puede ver la taza y ajustar su pinza para mover la taza a donde quieras, está mucho más cerca de una IA física.

Entonces, la IA física no es realmente un modelo único que hace una sola cosa. Es todo un sistema que tiene que:

Figura 1. IA física: un sistema que puede detectar, comprender, predecir, planificar, actuar y recibir retroalimentación. (Imagen del autor)

Con esta definición en mente, ahora podemos separar la IA física de los términos cercanos con los que se mezcla con mayor frecuencia.

Comencemos con el modelo mundial.

2. IA física versus modelo mundial

El término modelos mundiales [2] A menudo aparece en las mismas conversaciones sobre robots, agentes autónomos, simulación, entornos sintéticos, etc. Si no tenemos cuidado, es muy fácil caer en tratarlo como una forma más de decir IA física.

Pero eso no es cierto.

World Model es, como su nombre indica, un modelo. Más concretamente, este modelo es una representación interna de cómo cambia un entorno. Lo que surge naturalmente de esto es la capacidad de predicción. Permite que un agente en ese entorno anticipe lo que viene a continuación. Si sigo adelante, ¿con qué me topo? Si empujo este objeto, ¿se desliza o cae? Si ese auto cambia de carril, ¿dónde estará en dos segundos? Todas esas preguntas pueden responderse con esa capacidad de predicción.

Un robot podría utilizar un modelo mundial para imaginar lo que podría suceder si se acercara a la taza desde diferentes ángulos. Pero la comprensión clave aquí es que el modelo del mundo en sí no es el robot, ni la pinza, ni el controlador del motor, ni el sistema completo que realmente mueve la taza.

En realidad, esa es la relación clave aquí: un modelo mundial puede vivir dentro de la IA física, especialmente para simulación, entrenamiento y planificación. Pero por sí solo, sólo predice futuros posibles; no actúa. Sin sensores/controles/actuadores que se conecten al mundo real, sólo puede imaginarse.

Figura 2. El modelo mundial predice, la IA física actúa.

En resumen: los modelos mundiales predicen lo que podría suceder. La IA física actúa en el mundo real.

3. IA física versus IA encarnada

Este es el par que la gente confunde más. Puede ver que la gente y muchas empresas utilizan los dos términos indistintamente. De hecho, en una publicación reciente de Cambridge Consultants [3]el jefe de innovación de Capgemini la llamó literalmente “IA física o IA encarnada, como algunos la llaman”.

Pero creo que hay una distinción útil que podemos tener presente, y la clave está en lo que enfatizan.

IA física enfatizarEs lo que hace un sistema, y ​​esto incluye percibir, decidir y actuar en el mundo real. La IA incorporada, por otro lado, tiene más que ver con lo que da forma a la inteligencia.

El “encarnado” en su nombre proviene de la hipótesis de la encarnación. [4]. Esa hipótesis cree que la inteligencia no reside sólo en el software que se carga en una máquina. Está surgiendo de tener un cuerpo. Con el cuerpo, éste puede sentir, probar cosas y aprender de lo que sucede. El cuerpo aquí no es el dispositivo de salida al final del proceso; En primer lugar, es efectivamente parte de cómo aprende a pensar.

Sin embargo, en la práctica, la IA física y la IA encarnada suelen ir de la mano. Esto es especialmente cierto en los debates prácticos sobre robótica, ya que muchos robots reales son tanto IA encarnada como IA física.

Figura 3. La IA física actúa en el mundo. La IA encarnada aprende a través de un cuerpo. (Imagen del autor)

En resumen: la IA física se trata de actuar en el mundo. La IA incorporada se trata de que la inteligencia sea moldeada por un cuerpo y su interacción con el entorno.

4. IA física versus IA física

Esta pareja es fácil de confundir si no tienes cuidado al leer sus nombres. Uno es físico, el otro es Física.

Cuando la gente dice Física IA, normalmente se refieren a métodos de IA que incorporan las leyes de la física. Un buen ejemplo es la red neuronal basada en la física, o PINN. [5].

Técnicamente, PINN es sólo una red neuronal ordinaria. Lo que los diferencia es la formulación de pérdidas. Además de la pérdida cuadrática media habitual entre las predicciones y las observaciones, el modelo también se ve penalizado cuando sus predicciones violan las ecuaciones o restricciones físicas conocidas.

Tomemos como ejemplo el enfriamiento de la batería. Digamos que queremos predecir la evolución de la temperatura dentro de un paquete de baterías en diferentes condiciones de funcionamiento de la batería. Un modelo neuronal basado exclusivamente en datos aprendería el patrón directamente a partir de las lecturas del sensor. Un PINN aprendería de los mismos datos, pero además, también se requiere que respete las ecuaciones de balance de energía y las restricciones iniciales/límites conocidas mediante la inyección de esos términos de pérdida basados ​​en la física.

Esto es muy útil porque el modelo puede producir predicciones físicamente plausibles en lugar de alucinar. Además, tiene el potencial de permitir que el modelo alcance el mismo nivel de precisión pero con un tamaño de datos reducido. Un beneficio adicional es que puede generalizarse mejor en condiciones no cubiertas por el conjunto de entrenamiento.

Sin embargo, por sí sola, la IA física sigue siendo sólo un modelo. Puede predecir o simular un proceso físico, pero no realiza la acción en el mundo real.

Y esa es la distinción clave de la IA física.

En la práctica, la IA física puede convertirse en IA física cuando está conectada al circuito de acción. Para nuestro ejemplo de enfriamiento de la batería, si un sistema de control de enfriamiento inteligente lee las predicciones producidas por el modelo de temperatura y ajusta la velocidad del ventilador en consecuencia en tiempo real, entonces el modelo consciente de la física ahora es parte de un sistema de IA física.

Figura 4. Física La IA trata sobre leyes físicas. La IA física se trata de acción física. (Imagen del autor)

En resumen: la física de la IA se trata de leyes físicas. La IA física se trata de acción física.

5. IA física versus gemelo digital

Gemelos digitales es otro término confuso, especialmente en entornos industriales como fábricas, almacenes o sistemas autónomos.

Aquí hay una definición ampliamente adoptada de gemelo digital. [6]: es una representación virtual de un objeto, proceso o sistema físico real. El gemelo digital suele estar conectado a los datos del sistema real y puede actualizarse a medida que el sistema real evoluciona.

En la fábrica, se suele utilizar un gemelo digital de línea de producción. Una línea de producción en una fábrica normalmente consta de máquinas, transportadores, sensores, productos, estaciones de control de calidad, etc., y el gemelo digital correspondiente es una réplica virtual de esa línea. Incorpora varias lecturas de sensores, estado de la máquina y registros de mantenimiento para comprender el estado actual de la línea. A medida que cambia la línea de producción real, actualiza la vista virtual en tiempo real.

Ahora, con este gemelo virtual, los ingenieros de producción pueden monitorear el estado de la línea y posiblemente identificar cuellos de botella en la eficiencia. Otro uso común de un gemelo digital es simular escenarios hipotéticos para optimizar la política de operación antes de implementarla en la realidad.

Pero nada de eso convierte al gemelo digital en una IA física, ya que el gemelo digital no decide ni actúa por sí solo en la línea de producción real.

Figura 5. Un gemelo digital representa un sistema físico. La IA física actúa en un sistema físico. (imagen del autor)

En resumen: un gemelo digital representa un sistema físico. La IA física actúa en un sistema físico.

6. Armarlo todo

Ahora que analizamos los diferentes términos que hemos cubierto, podemos ver que se destaca un patrón: los modelos mundiales, la IA incorporada, la IA física y los gemelos digitales tienen que ver con la comprensión o la representación del mundo físico. La IA física es la única que se define actuando en ella.

En un sistema real, esos conceptos diferentes definitivamente pueden (y probablemente deberían) funcionar juntos: para respaldar a un solo robot que actúa en el mundo físico, se podrían usar gemelos digitales para ayudar al robot a planificar, y se podría usar un modelo mundial o un modelo consciente de la física para generar predicciones que guíen la acción del robot.

Con suerte, la próxima vez que encuentre estos términos en un titular, un artículo o una presentación de producto, podrá diferenciarlos en lugar de dejar que se confundan.

Figura 6. Relación entre varios términos. (Imagen del autor)

Referencias

[1] NVIDIA, “¿Qué es la IA física?” Enlace: https://www.nvidia.com/en-us/glossary/generative-physical-ai/

[2] Ha & Schmidhuber, “World Models”, 2018. Enlace: https://arxiv.org/abs/1803.10122

[3] Cambridge Consultants, “La IA física y la robótica humanoide se encuentran en un punto de inflexión”. Enlace: https://www.cambridgeconsultants.com/physical-ai-and-humanoid-robotics-at-a-turning-point/

[4] Smith & Gasser, “El desarrollo de la cognición incorporada: seis lecciones de los bebés”. Enlace: https://pubmed.ncbi.nlm.nih.gov/15811218/

[5] Raissi, Perdikaris y Karniadakis, “Redes neuronales basadas en la física”, 2019. Enlace: https://doi.org/10.1016/j.jcp.2018.10.045

[6] IBM, “¿Qué es un gemelo digital?” Enlace: https://www.ibm.com/think/topics/digital-twin