Meta AI presenta Searchformer para mejorar la eficiencia de la planificación: un modelo transformador para tareas complejas de toma de decisiones

El crecimiento de la Inteligencia Artificial (IA), con Transformers a la cabeza, abarca desde aplicaciones de IA conversacional hasta la generación de imágenes y videos. Sin embargo, los planificadores simbólicos tradicionales han tenido ventaja en tareas complejas de planificación y toma de decisiones debido a su enfoque estructurado y basado en reglas.

El problema que nos ocupa gira en torno a las limitaciones inherentes de los modelos Transformer actuales a la hora de resolver tareas complejas de planificación y razonamiento. A pesar de carecer de la comprensión matizada del lenguaje natural que ofrece Transformers, los métodos tradicionales destacan en la planificación de tareas debido a sus estrategias de búsqueda sistemática y, a menudo, vienen con garantías de optimización.

El trabajo existente aprovecha conjuntos de datos sintéticos para aprender políticas sólidas de razonamiento, mientras que este estudio se centra en mejorar la capacidad de razonamiento integrada en los pesos de un transformador. Algoritmos como AlphaZero, MuZero y AlphaGeometry tratan los modelos de redes neuronales como cajas negras y utilizan técnicas de planificación simbólica para mejorar la red. Técnicas como las indicaciones de Cadena de Pensamiento y Árbol de Pensamientos se han mostrado prometedoras, pero también presentan limitaciones, como inconsistencias en el desempeño entre diferentes tipos de tareas o conjuntos de datos.

El equipo de investigación de Meta ha presentado Searchformer, un novedoso modelo Transformer que mejora significativamente la eficiencia de la planificación en tareas complejas como los rompecabezas de Sokoban. A diferencia de los enfoques tradicionales, Searchformer combina las fortalezas de Transformers con la dinámica de búsqueda estructurada de los planificadores simbólicos, lo que lleva a un proceso de planificación más eficiente.

Searchformer puede resolver tareas de planificación complejas de manera más eficiente que los algoritmos de planificación tradicionales como la búsqueda A*. Se entrena en dos pasos: primero, se entrena para imitar el procedimiento de búsqueda de búsqueda A* utilizando conjuntos de datos sintéticos generados a partir de instancias de tareas de planificación generadas aleatoriamente. En el segundo paso, el modelo se mejora aún más mediante la iteración experta, lo que anima al Transformer a generar menos pasos de búsqueda mientras encuentra soluciones óptimas. Se produjeron dos secuencias de tokens: una con dinámica de búsqueda aumentada y otra centrada únicamente en soluciones. Al entrenar modelos Transformer para predecir estas secuencias, los investigadores intentaron capturar el proceso computacional de A*. Otras mejoras implicaron ajustar estos modelos en conjuntos de datos de secuencias progresivamente más cortas que aún conducían a resultados óptimos, mejorando significativamente la eficiencia al reducir los pasos de búsqueda necesarios para la resolución de problemas.

Se consideraron varias métricas para la evaluación del desempeño, como porcentaje de tareas resueltas, porcentaje de soluciones óptimas, éxito ponderado por costo (SWC) y índice de longitud mejorada (ILR). Los modelos de búsqueda aumentada y Searchformer funcionan mejor con respecto a estas métricas que los modelos de solo solución. Resuelve de manera óptima acertijos Sokoban nunca antes vistos el 93,7% del tiempo, utilizando hasta un 26,8% menos de pasos de búsqueda que la búsqueda estándar A*. También supera las líneas de base en tareas de navegación por laberintos, con un tamaño de modelo entre 5 y 10 veces más pequeño y un conjunto de datos de entrenamiento 10 veces más pequeño.

En conclusión, Searchformer marca un importante paso adelante en la planificación de la IA, ofreciendo un vistazo a un futuro en el que la IA puede navegar por tareas complejas de toma de decisiones con una eficiencia y precisión sin precedentes. Al abordar los desafíos de la planificación en IA, el equipo de investigación sienta las bases para crear sistemas de IA más capaces y eficientes. Su trabajo mejora nuestra comprensión del potencial de la IA en la resolución de problemas complejos y sienta las bases para futuros desarrollos en este campo.

Revisar la Papel. Todo el crédito por esta investigación va a los investigadores de este proyecto. Además, no olvides seguirnos en Gorjeo y noticias de Google. Unirse nuestro SubReddit de 38k+ ML, 41k+ comunidad de Facebook, Canal de discordiay LinkedIn Grarriba.

Si te gusta nuestro trabajo, te encantará nuestro Boletin informativo..

No olvides unirte a nuestro Canal de telegramas

También te puede gustar nuestro Cursos GRATUITOS de IA….

Nikhil es consultor interno en Marktechpost. Está cursando una doble titulación integrada en Materiales en el Instituto Indio de Tecnología de Kharagpur. Nikhil es un entusiasta de la IA/ML que siempre está investigando aplicaciones en campos como los biomateriales y la ciencia biomédica. Con una sólida formación en ciencia de materiales, está explorando nuevos avances y creando oportunidades para contribuir.

🐝 Únase al boletín informativo de investigación de IA de más rápido crecimiento leído por investigadores de Google + NVIDIA + Meta + Stanford + MIT + Microsoft y muchos otros…

Meta AI presenta Searchformer para mejorar la eficiencia de la planificación: un modelo transformador para tareas complejas de toma de decisiones

ByEquipo de 7 minutos

By Equipo de 7 minutos

Related Post

Anthropic Claude Sonnet 5 vs Sonnet 4.6 vs Opus 4.8: Comparación de puntos de referencia de codificación agente, precios de API y compensaciones entre costo y rendimiento

Agentes de IA crean áreas de juego virtuales para ayudar a los robots a obtener datos de entrenamiento cruciales | Noticias del MIT

OpenAI GPT-5.6 Sol, Terra y Luna ahora están disponibles de forma generalizada en Amazon Bedrock

You missed

Prolo, con sede en Londres, obtiene 4,9 millones de euros para llevar las adquisiciones basadas en IA a las pymes constructoras

Seguridad solar en verano para adultos mayores – The Leader

Padre furioso habla mientras continúa la búsqueda del entrenador de fútbol desaparecido