Screenshot 2024 08 26 At 7.59.06 Pm.png

La planificación de la inteligencia artificial (IA) implica la creación de una secuencia de acciones para alcanzar un objetivo específico en el desarrollo de sistemas autónomos que realizan tareas complejas, como la robótica y la logística. Además, los modelos de lenguaje de gran tamaño (LLM) han demostrado ser muy prometedores en varias áreas centradas en el procesamiento del lenguaje natural y la generación de código. Sin embargo, si uno tiene que generar un plan completo, la aplicación de LLM para la planificación de la IA plantea algunos desafíos; un caso surge cuando uno tiene que crear no solo planes sólidos sino completos. La solidez garantiza que un plan sea válido y conduzca hacia un objetivo, y la integridad garantiza que se consideren todas las soluciones posibles. El principal desafío dentro de este dominio es equilibrar la flexibilidad y el tiempo invertido, la precisión y la viabilidad, la confiabilidad y la abundancia o vaguedad de la información.

El problema que se resuelve principalmente con esta investigación es el de aportar solidez y exhaustividad a la planificación de la IA cuando se trabaja con LLM. Esto suele implicar métodos que son mucho más escalables y eficaces que el enfoque tradicional de recopilar comentarios y contar con expertos humanos que guíen la fase de planificación. El problema radica en automatizar este proceso con una pérdida mínima de precisión y fiabilidad en LLM. Los investigadores son especialmente sensibles a la disminución de esta dependencia de la intervención humana, que ha sido uno de los principales obstáculos para el desarrollo de sistemas de planificación de IA escalables.

Estos diversos desafíos se han estudiado a través de varios enfoques, donde algunos parecen prometedores mientras que otros siguen siendo ineficientes. Tratar los LLM como modelos mundiales Varios métodos implican el uso de LLM como modelos mundiales que definen el espacio de búsqueda para las tareas de planificación. En contraste, otros métodos incluyen el uso de LLM para generar planes completos o modelos de planificación que los sistemas automatizados evalúan. A menudo, las diversas técnicas disponibles han necesitado más confiabilidad y eficiencia debido a muchos factores diferentes, principalmente la fuerte dependencia de la retroalimentación humana. Tales métodos hacen necesario incorporar medidas de automatización más efectivas con respecto a los errores o el refinamiento de los planes generados, lo que, a su vez, limita aún más su escalabilidad y efectividad general.

Para ello, investigadores de la Universidad de Cornell e IBM Research han presentado AutoToS, diseñado desde cero para generar componentes de búsqueda sólidos y completos de forma automática sin supervisión humana. Su objetivo es mejorar los componentes de las búsquedas generadas por LLM mediante pruebas unitarias y procesos de depuración automatizados. AutoToS ofrece la garantía de que, a través de los bucles de retroalimentación, el código guiado por LLM cumplirá de forma suficiente con los criterios de cumplimiento, como la solidez y la integridad en términos de planificación. Es una contribución clave al campo de la planificación con IA y aporta una escalabilidad y una eficiencia significativamente mayores.

Esta metodología es notable tanto por su novedad como por su profundidad. En ella, el sistema extrae funciones sucesoras y una prueba de objetivos del LLM; después, prueba automáticamente estos componentes mediante pruebas unitarias genéricas y específicas del dominio. Si algunos elementos no satisfacen las condiciones de solidez o completitud, AutoToS devuelve una retroalimentación detallada al LLM, solicitando revisiones del código. Este es un proceso iterativo hasta el punto en el que los componentes generados están completamente validados. El hecho es que AutoToS realiza una búsqueda en amplitud y una búsqueda en profundidad con comprobaciones adicionales para garantizar que el proceso de búsqueda sea sólido y completo. Esta metodología no solo automatiza la retroalimentación, sino que también reduce drásticamente la cantidad de iteraciones necesarias para llegar a resultados correctos.

Este rápido rendimiento de AutoToS se examinó críticamente en varios problemas de referencia en el dominio de la búsqueda, y los resultados fueron bastante convincentes. Nuestro sistema logró una precisión del 100% en todos los dominios que probamos con éxito: BlocksWorld, PrOntoQA, Mini Crossword, el juego 24 y Sokoban. Para obtener este mismo nivel de rendimiento, AutoToS necesitó significativamente menos iteraciones de retroalimentación. Por ejemplo, AutoToS necesitó, en promedio, 2,6 llamadas al LLM para obtener una precisión del 100% en el dominio del juego 24. El sistema logró un rendimiento perfecto en el dominio BlocksWorld, con un promedio de solo 2,8 llamadas. Resultados como este respaldan la noción de que una retroalimentación sólida y completa puede dar como resultado soluciones aceptables y correctas con la mínima intervención por parte del ser humano. Para confirmar aún más el papel clave que desempeñan la solidez y la integridad de la retroalimentación, los investigadores también llevaron a cabo un estudio de ablación.

En otras palabras, el estudio concluye presentando a AutoToS como un sistema de última generación en planificación con IA que genera automáticamente componentes de búsqueda sólidos y completos. Al prescindir de la necesidad de retroalimentación humana, AutoToS garantiza una solución escalable y eficiente para problemas de planificación complejos con garantías de su corrección y fiabilidad. El esfuerzo grupal entre IBM Research y la Universidad de Cornell ha manifestado horizontes completamente nuevos en el campo: un sistema de retroalimentación automatizado que, sin mucha dificultad, supera los resultados basados ​​en la intervención humana. Este trabajo abre caminos para futuros desarrollos en el dominio de la planificación con IA, con potencial aplicabilidad de enfoques similares en una amplia gama de dominios.


Echa un vistazo a la Papel. Todo el crédito por esta investigación corresponde a los investigadores de este proyecto. Además, no olvides seguirnos en Gorjeo y únete a nuestro Canal de Telegram y LinkedIn Gr¡Arriba!. Si te gusta nuestro trabajo, te encantará nuestro hoja informativa..

No olvides unirte a nuestro Subreddit con más de 50 000 millones de usuarios

Encuentra lo próximo Seminarios web sobre IA aquí


Nikhil es consultor en prácticas en Marktechpost. Está cursando una doble titulación integrada en Materiales en el Instituto Indio de Tecnología de Kharagpur. Nikhil es un entusiasta de la IA y el aprendizaje automático que siempre está investigando aplicaciones en campos como los biomateriales y la ciencia biomédica. Con una sólida formación en ciencia de los materiales, está explorando nuevos avances y creando oportunidades para contribuir.