Este artículo sobre IA de UCSD y Johns Hopkins presenta el marco LAW: un salto en el aprendizaje automático con modelos integrados de lenguaje, agentes y mundo para un razonamiento mejorado

El campo de investigación relacionado con este estudio gira en torno al avance de las capacidades de razonamiento automático. Este campo explora la intersección de los modelos de lenguaje, agente y mundo, centrándose en mejorar las capacidades de razonamiento y planificación de los sistemas de IA. Este campo interdisciplinario se basa en la ciencia cognitiva, la lingüística, la informática y la inteligencia artificial para desarrollar mecanismos de razonamiento más sólidos y versátiles para las máquinas, especialmente en escenarios complejos del mundo real.

El principal problema abordado en esta investigación son las limitaciones inherentes de los LLM actuales con respecto al razonamiento y la planificación consistentes en diversos escenarios. Estas limitaciones incluyen la ambigüedad y la imprecisión del lenguaje natural, la ineficiencia del lenguaje como medio para razonar en ciertas situaciones y la necesidad de una base y un contexto del mundo real. La investigación tiene como objetivo superar estos desafíos mediante la introducción de un marco más integrado y completo para el razonamiento automático.

Actualmente, el razonamiento automático se basa predominantemente en los LLM. Estos modelos han demostrado fuertes capacidades en tareas lingüísticas, pero enfrentan limitaciones en la inferencia, el aprendizaje y el modelado, particularmente en contextos sociales y del mundo real. Los enfoques existentes necesitan simular acciones eficientemente y sus efectos en los estados del mundo, lo que lleva a un razonamiento y una planificación inconsistentes. La investigación identifica estas brechas como áreas críticas para mejorar.

Los investigadores de UCSD y JHU proponen un marco conocido como marco LAW, que integra modelos de lenguaje, modelos de agentes y modelos mundiales. Este marco tiene como objetivo mejorar las capacidades de razonamiento de las máquinas incorporando elementos esenciales del razonamiento humano, como creencias, objetivos, anticipación de consecuencias y planificación estratégica. El marco LAW es una abstracción más eficaz para el razonamiento automático, superando las limitaciones de los métodos actuales basados ​​en LLM.

El marco LAW reinventa el papel de los LLM en el razonamiento. Utiliza LLM como backend, operacionalizando el marco mientras aprovecha la potencia computacional y la adaptabilidad de estos modelos. El marco introduce los conceptos de modelos mundiales para comprender y predecir realidades externas y modelos de agentes para incorporar las metas y creencias de un agente. Esta estructura permite un proceso de inferencia más fundamentado y coherente, facilitando un razonamiento sólido en diversos escenarios.

El marco LAW ha mostrado resultados prometedores en la estructuración del razonamiento LLM con predicción del estado futuro y planificación estratégica. Aborda los desafíos de la dinámica de estado compleja e incierta en problemas de razonamiento del mundo real. El enfoque ha llevado a un aprendizaje más eficiente en términos de datos, una mejor generalización en escenarios invisibles y capacidades mejoradas de razonamiento de sentido común social y físico.

En conclusión, la investigación presenta un enfoque innovador del razonamiento automático, que aborda las limitaciones críticas de los LLM actuales. La integración de modelos de lenguaje, mundo y agentes en el marco LAW significa un salto sustancial hacia un razonamiento y una planificación más parecidos a los humanos en los sistemas de IA. El énfasis del marco en la comprensión multimodal, la planificación estratégica y la conexión con el mundo real podría ser fundamental para avanzar en las capacidades y aplicaciones de la IA.


Revisar la Papel. Todo el crédito por esta investigación va a los investigadores de este proyecto. Además, no olvides unirte. nuestro SubReddit de más de 35.000 ml, 41k+ comunidad de Facebook, Canal de discordia, LinkedIn Grarribay Boletín electrónicodonde compartimos las últimas noticias sobre investigaciones de IA, interesantes proyectos de IA y más.

Si te gusta nuestro trabajo, te encantará nuestra newsletter.


Hola, mi nombre es Adnan Hassan. Soy pasante de consultoría en Marktechpost y pronto seré aprendiz de gestión en American Express. Actualmente estoy cursando una doble titulación en el Instituto Indio de Tecnología, Kharagpur. Me apasiona la tecnología y quiero crear nuevos productos que marquen la diferencia.