Adaptar modelos de idiomas grandes para dominios especializados sigue siendo desafiante, especialmente en los campos que requieren razonamiento espacial y resolución de problemas estructurados, a pesar de que se especializan en un razonamiento complejo. El diseño del diseño de semiconductores es un excelente ejemplo, donde las herramientas de IA deben interpretar restricciones geométricas y garantizar una ubicación precisa de los componentes. Los investigadores están desarrollando arquitecturas de IA avanzadas para mejorar la capacidad de LLM para procesar y aplicar el conocimiento específico del dominio de manera efectiva.

Una limitación importante de los LLM de uso general es su incapacidad para convertir el conocimiento teórico en soluciones prácticas. Si bien estos modelos pueden definir con precisión los conceptos técnicos, a menudo fallan al resolver tareas del mundo real que requieren razonamiento espacial y lógica estructurada. En el diseño de diseño de semiconductores, la IA debe ir más allá del conocimiento basado en el texto para garantizar la colocación precisa de las vías, las capas metálicas y los componentes del circuito. Sin relaciones geométricas precisas, los diseños de diseño pueden fallar debido a la desalineación o un espaciado incorrecto. Los modelos actuales a menudo requieren múltiples rondas de corrección humana, lo que hace que su despliegue sea ineficiente.

Se han desarrollado varios enfoques para mejorar la adaptabilidad de las LLM para aplicaciones específicas de dominio. El ajuste fino implica capacitar LLM con datos específicos del dominio, pero este proceso tiene mucho tiempo y requiere recursos computacionales significativos. Generación de recuperación de la recuperación (TRAPO) Recupera el conocimiento externo para guiar las salidas LLM, pero no aborda completamente los desafíos relacionados con la resolución estructurada de problemas. In-Context Learning ayuda a guiar el razonamiento LLM proporcionando ejemplos específicos de tareas, pero no supera las limitaciones de razonamiento espacial. Estos métodos ofrecen mejoras incrementales, pero no pueden ofrecer una solución integral para aplicaciones que requieren lógica geométrica.

Los investigadores del Centro de Investigación de IBM TJ Watson y el laboratorio MIT-IBM Watson AI introdujeron Solomon, una red de razonamiento LLM neuroinspirada, para mejorar la adaptabilidad específica del dominio. A diferencia de los enfoques convencionales, Solomon emplea un sistema de razonamiento de múltiples agentes que procesa dinámicamente restricciones espaciales y relaciones geométricas. El marco integra mecanismos de evaluación de pensamiento para refinar las salidas de forma iterativa, mejorando la precisión de resolución de problemas. Solomon aprovecha técnicas de ingeniería rápida para guiar soluciones generadas por LLM, lo que le permite adaptarse a las tareas de diseño de semiconductores con un reentrenamiento mínimo.

La arquitectura de Salomón se inspira en la neurociencia e incorpora el principio de energía libre, que optimiza el razonamiento al reducir las discrepancias entre los resultados esperados y observados. El marco consta de tres componentes principales: generadores de pensamiento, evaluadores de pensamiento y un subsistema de dirección. Los generadores de pensamiento utilizan diversos LLM para producir múltiples vías de razonamiento, asegurando una amplia gama de soluciones para tareas complejas. El evaluador de pensamiento evalúa estas salidas, seleccionando el enfoque más lógico y estructurado. El subsistema de dirección permite a los investigadores modificar los objetivos dinámicamente, permitiendo una adaptación de dominio más precisa. A diferencia del ajuste fino, esta arquitectura no requiere un reentrenamiento continuo, lo que lo hace más eficiente para aplicaciones especializadas.

Los investigadores realizaron experimentos en 25 tareas de diseño de semiconductores para evaluar la efectividad de Salomón. El marco se comparó con cinco LLM de línea de base, incluidos los modelos GPT-4O, Claude-3.5-Sonnet y LLAMA-3. Cada tarea evaluó la capacidad de los modelos para generar estructuras geométricas mientras se mantiene la precisión espacial. Salomon demostró mejoras en la reducción de los errores de tiempo de ejecución y la escala inexactitud. El marco exhibió mejores capacidades de razonamiento espacial, mejorando la precisión de la colocación y reduciendo los errores en los diseños generados. Las instancias de Solomon también coincidieron o excedieron el rendimiento de la previsión O1 en múltiples categorías de pruebas, con el Salomón basado en Claude con un gran rendimiento en ciertas tareas complejas.

Una ventaja clave de Salomón es su capacidad para corregir inconsistencias lógicas y errores aritméticos en diseños geométricos. El asesor de pensamiento refina continuamente los diseños generados mediante el análisis de iteraciones anteriores, mitigando problemas de alucinación comunes en LLM tradicionales. El sistema reduce efectivamente las interpretaciones erróneas y mejora la confiabilidad de los diseños generados por IA. Solomon sincroniza el razonamiento en múltiples LLM cuando se presenta con especificaciones de diseño ambiguo, asegurando un resultado consistente y preciso. Al incorporar mecanismos de evaluación jerárquica, el marco mejora significativamente la precisión del diseño impulsada por la IA.

Esta investigación destaca la importancia de mejorar las capacidades de razonamiento de LLM en lugar de aumentar el tamaño del modelo. Solomon ofrece un enfoque estructurado y eficiente para aplicar la IA a la resolución de problemas específicos del dominio, particularmente en el diseño de diseño de semiconductores. La investigación futura se centrará en ampliar el marco a otras aplicaciones de ingeniería, refinar las capacidades de razonamiento multimodal e introducir mecanismos de aprendizaje iterativos para mejorar la toma de decisiones de la IA. La introducción de Salomón representa un avance sustancial en hacer que las herramientas impulsadas por la IA sean más precisas, adaptativas y efectivas para los desafíos industriales del mundo real.


Verificar el Papel. Todo el crédito por esta investigación va a los investigadores de este proyecto. Además, siéntete libre de seguirnos Gorjeo Y no olvides unirte a nuestro 75k+ ml de subreddit.

🚨 Plataforma de IA de código abierto recomendada: ‘Intellagent es un marco de múltiples agentes de código abierto para evaluar el complejo sistema de IA conversacional(Promocionado)


Nikhil es consultor interno en MarktechPost. Está buscando un doble grado integrado en materiales en el Instituto Indio de Tecnología, Kharagpur. Nikhil es un entusiasta de AI/ML que siempre está investigando aplicaciones en campos como biomateriales y ciencias biomédicas. Con una sólida experiencia en la ciencia material, está explorando nuevos avances y creando oportunidades para contribuir.

Por automata