Este artículo sobre IA de Meta AI presenta Dualformer: pensamiento rápido y lento controlable con rastros de razonamiento aleatorios, que revoluciona la toma de decisiones con IA

Un desafío importante en la investigación de la IA es cómo desarrollar modelos que puedan equilibrar un razonamiento rápido e intuitivo con un razonamiento más lento y detallado de una manera eficiente. La cognición humana opera mediante dos sistemas: el Sistema 1, que es rápido e intuitivo, y el Sistema 2, que es lento pero más analítico. En los modelos de IA, esta dicotomía entre los dos sistemas se presenta principalmente como una compensación entre eficiencia y precisión computacional. Los modelos rápidos arrojan principalmente resultados rápidos, pero sobre todo sacrificando la precisión, mientras que los modelos lentos arrojan una alta precisión pero con un precio de gasto computacional y requieren mucho tiempo. Es un desafío integrar estos dos modos en uno sin problemas, lo que permite una toma de decisiones eficiente sin degradación del rendimiento. Aquí es donde radica gran parte del desafío, y superarlo mejoraría en gran medida la aplicabilidad de la IA en tareas complejas del mundo real como la navegación, la planificación y el razonamiento.

Las técnicas actuales para el manejo de tareas de razonamiento generalmente dependen de una toma de decisiones rápida e intuitiva o de un procesamiento lento y deliberado. Los modelos rápidos, como los modelos de solo solución, capturan soluciones sin pasos hasta el motivo, las opciones son modelos operativos menos precisos y subóptimos para tareas complejas. Por otro lado, los modelos que se basan en rastreos de razonamiento lentos y completos, como Searchformer, proporcionan una mayor precisión, pero tienen un rendimiento inferior debido a pasos de razonamiento más largos y su alto costo computacional. La mayoría de los métodos que combinan estos modos, como destilar el resultado del razonamiento lento en modelos rápidos, a menudo requieren ajustes adicionales y controladores externos, lo que aumenta rápidamente la complejidad y limita la flexibilidad. La gran limitación en este campo sigue siendo la ausencia de un marco unificado que sea capaz de cambiar dinámicamente entre modos de razonamiento rápido y lento.

Los investigadores de Meta presentan Dualformer, una solución novedosa que integra perfectamente el razonamiento rápido y lento en un único modelo basado en transformador. Utiliza rastreos de razonamiento aleatorios durante el entrenamiento para que el modelo aprenda a adaptarse entre un modo rápido de solo solución y un modo de razonamiento más lento basado en rastreos. Por el contrario, Dualformer ajusta de forma automática y consistente su procedimiento de razonamiento según las dificultades de la tarea y cambia de manera flexible entre los modos. Esta novedad aborda directamente las limitaciones de los modelos anteriores con una eficiencia computacional mejorada y una mayor precisión del razonamiento. El modelo también reduce la sobrecarga computacional mediante el uso de estrategias estructuradas de seguimiento que imitan los atajos humanos al tomar decisiones.

El modelo construido se basa en un método sistemático de eliminación de rastros en el que los rastros de razonamiento se eliminan progresivamente a lo largo del proceso de entrenamiento para inculcar eficiencia. Por lo tanto, se puede realizar entrenamiento para dicha estrategia en tareas complejas como la navegación por laberintos o juegos de Sokoban utilizando rastros generados por el algoritmo de búsqueda A*. En este sentido, los nodos cerrados, los tokens de costos y los pasos de búsqueda en el rastro del razonamiento se eliminan selectivamente durante el entrenamiento para simular procesos de decisión mucho más rápidos. Esta aleatorización se realiza para alentar al modelo a generalizar bien entre tareas y al mismo tiempo ser eficiente en modos de razonamiento rápido y lento. La arquitectura Dual-former es un marco codificador-decodificador que puede manejar tareas de razonamiento tan complejas mientras intenta mantener los costos computacionales lo más bajos posible.

Dualformer demuestra resultados sobresalientes en una amplia variedad de tareas de razonamiento, superando significativamente su rendimiento de última generación tanto en precisión como en eficiencia computacional. Por lo tanto, en el modo lento, logra un 97,6 % de optimización para las tareas de laberinto utilizando un 45,5 % menos de pasos de razonamiento en comparación con el modelo básico de Searchformer. En el modo rápido, demuestra una tasa de solución óptima del 80%, superando así por un amplio margen al modelo de Solo solución, que alcanzó solo un rendimiento del 30%. Además de eso, cuando en modo automático el modelo selecciona su estrategia, ésta sigue siendo alta, con una tasa óptima alta del 96,6 % y casi un 60 % menos de pasos en comparación con otros enfoques. Estas actuaciones describen el equilibrio de los formadores duales entre velocidad computacional y precisión, de ahí su robustez y flexibilidad en tareas de razonamiento tan complejas.

En conclusión, Dualformer ha resuelto con éxito la incorporación del razonamiento rápido y lento en modelos de IA. Durante el entrenamiento, el modelo opera con rastreos de razonamiento aleatorios y estrategias estructuradas de eliminación de rastreos; por lo tanto, es eficiente en todas las modalidades de razonamiento y su aclimatación a la complejidad de la tarea es dinámica. Esto supone grandes reducciones en las demandas computacionales manteniendo una alta precisión, lo que muestra un salto en las tareas de razonamiento que requieren velocidad y precisión. Gracias a esta arquitectura innovadora y única, Dualformer abre nuevas posibilidades para aplicar la IA en escenarios complejos del mundo real, ampliando su potencial en diversos campos.


Mira el Papel. Todo el crédito por esta investigación va a los investigadores de este proyecto. Además, no olvides seguirnos en Gorjeo y únete a nuestro Canal de telegramas y LinkedIn Grarriba. Si te gusta nuestro trabajo, te encantará nuestro hoja informativa.. No olvides unirte a nuestro SubReddit de más de 55.000 ml.

[Upcoming Live Webinar- Oct 29, 2024] La mejor plataforma para ofrecer modelos optimizados: motor de inferencia Predibase (promocionado)


Aswin AK es pasante de consultoría en MarkTechPost. Está cursando su doble titulación en el Instituto Indio de Tecnología de Kharagpur. Le apasiona la ciencia de datos y el aprendizaje automático, y aporta una sólida formación académica y experiencia práctica en la resolución de desafíos interdisciplinarios de la vida real.