¿Cómo puede la inteligencia artificial salir de una pantalla y convertirse en algo que podamos tocar e interactuar físicamente?
Esa pregunta formó la base de la clase 4.043/4.044 (Inteligencia de interacción), un curso del MIT centrado en el diseño de una nueva categoría de objetos interactivos impulsados por IA. Conocidas como objetos de lenguaje grandes (LLO), estas interfaces físicas extienden los modelos de lenguaje grandes al mundo real. Sus comportamientos pueden generarse deliberadamente para personas o aplicaciones específicas, y sus interacciones pueden evolucionar de simples a cada vez más sofisticadas, brindando un soporte significativo tanto para usuarios novatos como expertos.
“Me di cuenta de que, aunque poderosas, estas nuevas formas de inteligencia siguen siendo en gran medida ignorantes del mundo fuera del lenguaje”, dice Marcelo Coelho, profesor asociado de la práctica en el Departamento de Arquitectura del MIT, quien ha estado enseñando en el estudio de diseño durante varios años y dirige el Laboratorio de Inteligencia de Diseño. “Carecen de comprensión contextual en tiempo real de nuestro entorno físico, experiencias corporales y relaciones sociales para ser verdaderamente inteligentes. Por el contrario, los LLO están situados físicamente e interactúan en tiempo real con su entorno físico. El curso es un intento de abordar esta brecha y desarrollar un nuevo tipo de disciplina de diseño para la era de la IA”.
Cuando se les asignó la tarea de diseñar un dispositivo interactivo que querrían tener en sus vidas, los estudiantes Jacob Payne y Ayah Mahmoud se centraron en la cocina. Si bien a ambos les gusta cocinar y hornear, su inspiración para el diseño provino de la primera computadora doméstica: la computadora de cocina Honeywell 316, comercializada por Neiman Marcus en 1969. Con un precio de $ 10,000, no hay registro de que alguna vez se haya vendido.
“Fue un primer intento ambicioso pero poco práctico de crear una computadora para la cocina doméstica”, dice Payne, un estudiante de posgrado en arquitectura. “Fue una referencia histórica intrigante para el proyecto”.
“Como alguien a quien le gusta aprender a cocinar, especialmente ahora, en la universidad, la idea de diseñar algo que facilite la cocina para aquellos que tal vez no tengan experiencia en cocina y solo quieran una buena comida que satisfaga sus antojos fue un excelente punto de partida para mí”, dice Mahmoud, estudiante de último año en diseño.
“Pensamos en los ingredientes sobrantes que tienes en el refrigerador o la despensa, y en cómo la IA podría ayudarte a encontrar nuevos usos creativos para cosas que de otro modo tirarías”, dice Payne.
cocina generativa
Los estudiantes diseñaron su dispositivo, llamado Kitchen Cosmo, con instrucciones para que funcione como un “generador de recetas”. Un desafío fue lograr que el LLM reconociera constantemente los parámetros de cocción del mundo real, como el calentamiento, el tiempo o la temperatura. Un problema que resolvieron fue que el LLM reconociera perfiles de sabor y especias precisos para platos regionales y culturales de todo el mundo para respaldar una gama más amplia de cocinas. La solución de problemas incluyó recetas de prueba de sabor generadas por Kitchen Cosmo. No todas las primeras recetas produjeron un plato ganador.
“Había muchas cosas pequeñas que la IA no comprendía conceptualmente bien”, dice Mahmoud. “Un LLM necesita comprender fundamentalmente el gusto humano para preparar una excelente comida”.
Ajustaron su dispositivo para permitir las innumerables formas en que las personas abordan la preparación de una comida. ¿Es esto desayuno, almuerzo, cena o merienda? ¿Qué tan avanzado eres como cocinero? ¿Cuánto tiempo tienes para preparar la comida? ¿Cuántas porciones harás? También se programaron las preferencias dietéticas, así como el tipo de estado de ánimo o vibra que se desea lograr. ¿Se siente nostálgico o tiene ganas de celebrar? Hay un dial para eso.
“Estas selecciones fueron el punto focal del dispositivo porque teníamos curiosidad por ver cómo el LLM interpretaría los adjetivos subjetivos como entradas y los usaría para transformar el tipo de resultados de recetas que obtendríamos”, dice Payne.
A diferencia de la mayoría de las interacciones de IA que tienden a ser invisibles, Payne y Mahmoud querían que su dispositivo fuera más bien un “compañero” en la cocina. La interfaz táctil fue diseñada intencionalmente para estructurar la interacción, brindando a los usuarios un control físico sobre cómo respondió la IA.
“Aunque ya había trabajado con electrónica y hardware antes, este proyecto me impulsó a integrar los componentes con un nivel de precisión y refinamiento que parecía mucho más cercano a un dispositivo listo para el producto”, dice Payne sobre el trabajo del curso.
Retro y rojo
Una vez completado su trabajo electrónico, los estudiantes diseñaron una serie de modelos utilizando cartón hasta decidirse por el aspecto final, que Payne describe como “retro”. El cuerpo fue diseñado en un software de modelado 3D e impreso. En un guiño a la computadora Honeywell original, la pintaron de rojo.
Kitchen Cosmo, un dispositivo delgado y rectangular de aproximadamente 18 pulgadas de alto, tiene una cámara web que se abre para escanear los ingredientes colocados en un mostrador. Los traduce en una receta que tiene en cuenta las especias y condimentos generales comunes en la mayoría de los hogares. Una impresora térmica integrada entrega una receta impresa que se arranca. Las recetas se pueden guardar en un recipiente de plástico situado en su base.
Si bien Kitchen Cosmo causó un modesto revuelo en las revistas de diseño, ambos estudiantes tienen ideas sobre dónde llevarán futuras versiones.
A Payne le gustaría que “aproveche muchos de los datos que tenemos en la cocina y utilice la IA como mediadora, ofreciendo consejos sobre cómo mejorar lo que está cocinando en ese momento”.
Mahmoud está estudiando cómo optimizar Kitchen Cosmo para su tesis. Los compañeros de clase han dado comentarios para mejorar sus habilidades. Una sugerencia es proporcionar instrucciones para varias personas que proporcionen a varias personas las tareas necesarias para completar una receta. Otra idea es crear un “modo de aprendizaje” en el que se coloca un utensilio de cocina (por ejemplo, un cuchillo de pelar) frente a Kitchen Cosmo y este ofrece instrucciones sobre cómo utilizarlo. Mahmoud también ha estado investigando la historia de la ciencia de los alimentos.
“Me gustaría entender mejor cómo entrenar la IA para que comprenda completamente los alimentos y pueda adaptar las recetas al gusto del usuario”, dice.
Habiendo comenzado su educación en el MIT como geóloga, el giro de Mahmoud hacia el diseño ha sido una revelación, dice. Cada clase de diseño ha sido inspiradora. El curso de Coelho fue su primera clase que incluyó el diseño con IA. Haciendo referencia a la analogía frecuentemente mencionada de “beber de una estación de bomberos” mientras estudiaba en el MIT, Mahmoud dice que el curso la ayudó a definir un camino en el diseño de productos.
“Por primera vez, en esa clase, sentí que finalmente estaba bebiendo tanto como podía y no me sentía abrumado. Me veo haciendo diseño a largo plazo, que es algo que no pensé que hubiera dicho antes sobre la tecnología”.