Mezclando IA generativa con física para crear objetos personales que funcionan en el mundo real

¿Alguna vez has tenido una idea para algo que parecía genial, pero que no funcionaría bien en la práctica? Cuando se trata de diseñar cosas como decoración y accesorios personales, los modelos de inteligencia artificial generativa (genAI) pueden relacionarse. Pueden producir diseños 3D creativos y elaborados, pero cuando se intenta convertir esos planos en objetos del mundo real, normalmente no soportan el uso diario.

El problema subyacente es que los modelos genAI a menudo carecen de comprensión de la física. Si bien herramientas como el sistema TRELLIS de Microsoft pueden crear un modelo 3D a partir de un mensaje de texto o una imagen, su diseño para una silla, por ejemplo, puede ser inestable o tener partes desconectadas. El modelo no comprende completamente para qué está diseñado el objeto previsto, por lo que incluso si su asiento puede imprimirse en 3D, probablemente se desmoronará bajo la fuerza de alguien que se siente.

En un intento por hacer que estos diseños funcionen en el mundo real, los investigadores del Laboratorio de Ciencias de la Computación e Inteligencia Artificial (CSAIL) del MIT están probando la realidad de los modelos generativos de IA. Su sistema “PhysiOpt” aumenta estas herramientas con simulaciones físicas, haciendo que los planos de artículos personales como tazas, llaveros y sujetalibros funcionen según lo previsto cuando se imprimen en 3D. Prueba rápidamente si la estructura de su modelo 3D es viable, modificando suavemente formas más pequeñas mientras garantiza que se conserve la apariencia general y la función del diseño.

Simplemente puede escribir lo que desea crear y para qué se utilizará en PhysiOpt, o cargar una imagen en la interfaz de usuario del sistema y, en aproximadamente medio minuto, obtendrá un objeto 3D realista para fabricar. Por ejemplo, los investigadores del CSAIL le pidieron que generara un “vaso para beber con forma de flamenco”, que imprimieron en 3D en un vaso con un mango y una base que se asemejaban a la pata del ave tropical. A medida que se generaba el diseño, PhysiOpt realizó pequeños ajustes para garantizar que el diseño fuera estructuralmente sólido.

“PhysiOpt combina GenAI y optimización de formas basadas en la física, ayudando a prácticamente cualquier persona a generar los diseños que desea para accesorios y decoraciones únicos”, dice el estudiante de doctorado en ingeniería eléctrica e informática (EECS) del MIT e investigador de CSAIL Xiao Sean Zhan SM ’25, quien es coautor principal de un artículo que presenta el trabajo. “Es un sistema automático que le permite hacer que la forma sea físicamente fabricable, dadas algunas limitaciones. PhysiOpt puede repetir sus creaciones tantas veces como desee, sin ningún entrenamiento adicional”.

Este enfoque le permite crear un “diseño inteligente”, en el que el generador de IA elabora su artículo según las especificaciones de los usuarios, teniendo en cuenta la funcionalidad. Puede conectar su modelo de IA generativa 3D favorito y, después de escribir lo que desea generar, especifica cuánta fuerza o peso debe soportar el objeto. Es una manera elegante de simular el uso en el mundo real, como predecir si un gancho será lo suficientemente fuerte como para sostener su abrigo. Los usuarios también especifican con qué materiales fabricarán el artículo (como plástico o madera) y cómo se sostiene; por ejemplo, una taza se apoya en el suelo, mientras que un sujetalibros se apoya contra una colección de libros.

Teniendo en cuenta los detalles, PhysiOpt comienza a optimizar iterativamente el objeto. Debajo del capó, ejecuta una simulación física llamada “análisis de elementos finitos” para probar el diseño. Este escaneo completo proporciona un mapa de calor sobre su modelo 3D, que indica dónde su plano no está bien respaldado. Si estuvieras generando, digamos, una pajarera, es posible que las vigas de soporte debajo de la casa fueran de color rojo brillante, lo que significa que la casa se derrumbará si no se refuerza.

PhysiOpt puede crear piezas aún más atrevidas. Los investigadores vieron esta versatilidad de primera mano cuando fabricaron un llavero steampunk (un estilo que combina la estética victoriana y futurista) con intrincados ganchos de aspecto robótico y una “mesa de jirafa” con un respaldo plano en el que se pueden colocar artículos. Pero, ¿cómo supo qué es el “steampunk” o cómo debería ser un mueble tan singular?

Sorprendentemente, la respuesta no es una formación exhaustiva, al menos no por parte de los investigadores. En cambio, PhysiOpt utiliza un modelo previamente entrenado que ya ha visto miles de formas y objetos. “Los sistemas existentes a menudo necesitan mucha formación adicional para tener una comprensión semántica de lo que se quiere ver”, añade el coautor principal Clément Jambon, que también es estudiante de doctorado del MIT EECS e investigador del CSAIL. “Pero utilizamos un modelo con esa sensación de lo que quieres crear ya integrado, por lo que PhysiOpt no requiere entrenamiento”.

Al trabajar con un modelo previamente entrenado, PhysiOpt puede utilizar “formas previas”, o conocimiento de cómo deberían verse las formas en función de un entrenamiento anterior, para generar lo que los usuarios quieren ver. Es como un artista recreando el estilo de un pintor famoso. Su experiencia se basa en el estudio de cerca de una variedad de enfoques artísticos, por lo que probablemente podrán reflejar esa estética particular. Del mismo modo, la familiaridad de un modelo previamente entrenado con las formas le ayuda a generar modelos 3D.

Los investigadores de CSAIL observaron que el conocimiento visual de PhysiOpt le ayudó a crear modelos 3D de manera más eficiente que “DiffIPC”, un método comparable que simula y optimiza formas. Cuando a ambos enfoques se les asignó la tarea de generar diseños 3D para elementos como sillas, el sistema de CSAIL fue casi 10 veces más rápido por iteración y, al mismo tiempo, creó objetos más realistas.

PhysiOpt presenta un puente potencial entre ideas y artículos personales del mundo real. Lo que podría parecer una gran idea para una taza de café, por ejemplo, pronto podría dar el salto de la pantalla de su computadora a su escritorio. Y aunque PhysiOpt ya realiza pruebas de estrés para los diseñadores, es posible que pronto pueda predecir restricciones como cargas y límites, en lugar de que los usuarios tengan que proporcionar esos detalles. Este enfoque más autónomo y de sentido común podría ser posible incorporando modelos de lenguaje visual, que combinan la comprensión del lenguaje humano con la visión por computadora.

Es más, Zhan y Jambon tienen la intención de eliminar los artefactos, o fragmentos aleatorios que ocasionalmente aparecen en los modelos 3D de PhysiOpt, haciendo que el sistema sea aún más consciente de la física. Los científicos del MIT también están considerando cómo pueden modelar restricciones más complejas para diversas técnicas de fabricación, como minimizar los componentes sobresalientes para la impresión 3D.

Zhan y Jambon escribieron su artículo con el científico investigador principal del MIT-IBM Watson AI Lab Kenney Ng ’89, SM ’90, PhD ’00 y dos colegas de CSAIL: el investigador universitario Evan Thompson y la profesora asistente Mina Konaković Luković, quien es investigadora principal en el laboratorio.

El trabajo de los investigadores fue apoyado, en parte, por el Laboratorio de IA Watson del MIT-IBM y Wistron Corp. Lo presentaron en diciembre en la Conferencia y Exposición SIGGRAPH de la Asociación de Maquinaria de Computación sobre Gráficos por Computadora y Técnicas Interactivas en Asia.

Mezclando IA generativa con física para crear objetos personales que funcionan en el mundo real | Noticias del MIT

ByEquipo de 7 minutos

By Equipo de 7 minutos

Related Post

Google DeepMind presenta Vision Banana: un generador de imágenes ajustado por instrucciones que supera a SAM 3 en segmentación y profundidad Anything V3 en estimación de profundidad métrica

Cómo seleccionar variables de forma sólida en un modelo de puntuación

Cómo mejorar el rendimiento del código Claude con pruebas automatizadas

You missed

Los viajes del Reino Unido a España corren peligro

Cuánto dinero ganó como entrenador – Hollywood Life

Un récord climático de 14 millones de años se esconde dentro de los Doce Apóstoles desaparecidos de Australia

Alex Jones perdió Infowars y ahora está perdiendo la cabeza