Investigadores de Stanford presentan TEXTGRAD: un potente marco de IA que realiza una “diferenciación” automática a través del texto

La inteligencia artificial (IA) está experimentando un cambio de paradigma, con avances impulsados ​​por sistemas que orquestan múltiples modelos de lenguajes grandes (LLM) y otros componentes complejos. Esta progresión ha puesto de relieve la necesidad de métodos de optimización eficaces para estos sistemas compuestos de IA, donde entra en juego la diferenciación automática. La diferenciación automática ha revolucionado el entrenamiento de redes neuronales y ahora los investigadores buscan aplicar principios similares para optimizar sistemas de IA más complejos a través de comentarios textuales de los LLM.

Un desafío importante en la IA es la optimización de sistemas compuestos que involucran múltiples componentes, como LLM, simuladores y herramientas de búsqueda web. Los métodos tradicionales dependen en gran medida de los ajustes manuales de los expertos, que requieren mucho tiempo y son propensos a errores humanos. Por lo tanto, existe una necesidad apremiante de métodos de optimización automatizados y basados ​​en principios que puedan manejar la complejidad y variabilidad de estos sistemas.

La investigación existente incluye marcos como DSPy, que optimiza mediante programación los sistemas basados ​​en LLM, y ProTeGi, que utiliza gradientes textuales para una optimización rápida. DSPy mejora el rendimiento de LLM en diversas tareas al estructurar sistemas complejos como programas en capas. ProTeGi se enfoca en mejorar las indicaciones a través de comentarios en lenguaje natural. Estos métodos automatizan el proceso de optimización pero se limitan a aplicaciones específicas. TEXTGRAD, inspirado en estos enfoques, amplía el uso de gradientes textuales a tareas de optimización más amplias, integrando las capacidades de razonamiento de los LLM en diversos dominios.

Investigadores de la Universidad de Stanford y Chan Zuckerberg Biohub han presentado TEXTOGRAD, un marco que realiza una diferenciación automática a través de texto, utilizando comentarios de LLM para optimizar los sistemas de inteligencia artificial. TEXTGRAD convierte cada sistema de IA en un gráfico de cálculo, donde las variables son entradas y salidas de funciones complejas. Aprovecha la retroalimentación en lenguaje natural rica e interpretable proporcionada por los LLM para generar “gradientes textuales”, que describen cómo se deben ajustar las variables para mejorar el rendimiento del sistema. Este enfoque innovador hace que TEXTGRAD sea flexible y fácil de usar, ya que los usuarios solo necesitan proporcionar la función objetivo sin ajustar componentes ni indicaciones.

TEXTOGRAD emplea LLM para generar comentarios detallados para diversas tareas, lo que hace que el marco sea aplicable en múltiples dominios. Por ejemplo, en el campo de la codificación, TEXTGRAD mejoró el rendimiento de los modelos de IA en problemas de codificación difíciles desde la plataforma LeetCode. Al identificar casos extremos que causaron fallas en las soluciones iniciales, TEXTGRAD brindó sugerencias de mejora, lo que condujo a una ganancia relativa de rendimiento del 20 %. En las tareas de respuesta a preguntas, TEXTGRAD mejoró la precisión de disparo cero de GPT-4 en el punto de referencia de respuesta a preguntas a prueba de Google del 51% al 55%. El marco también diseñó nuevas moléculas similares a medicamentos con propiedades deseables, mejorando significativamente la afinidad de unión y las métricas de similitud con los medicamentos.

TEXTOGRAD’Los resultados hablan por sí solos. En la optimización de la codificación, mejoró la tasa de éxito de GPT-4 del 7% al 23% en una configuración de disparo cero y del 15% al ​​31% cuando se usa Reflexion. En las tareas de resolución de problemas, aumentó la precisión de GPT-4 en el punto de referencia de respuesta a preguntas de Google-Proof al 55 %, el resultado más alto conocido para este conjunto de datos. Para el punto de referencia de comprensión del lenguaje multitarea (MMLU), aumentó la precisión del 85,7 % al 88,4 % en el subconjunto de aprendizaje automático y del 91,2 % al 95,1 % en el subconjunto de física universitaria. Estos impresionantes resultados subrayan la eficacia de TEXTGRAD para mejorar el rendimiento de la IA.

TEXTGRAD optimizó moléculas para una mejor afinidad de unión y similitud con los fármacos en química, lo que demuestra su versatilidad en tareas de optimización multiobjetivo. El marco generó moléculas con altas afinidades de unión y puntuaciones favorables de similitud con los fármacos comparables a los fármacos clínicamente aprobados. En aplicaciones médicas, TEXTGRAD mejoró los planes de tratamiento de radioterapia al optimizar los hiperparámetros para atacar mejor los tumores y minimizar el daño a los tejidos sanos. La capacidad del marco para proporcionar orientación significativa a través de gradientes textuales dio como resultado planes de tratamiento que cumplieron los objetivos clínicos de manera más efectiva que los métodos tradicionales.

En conclusión, TEXTGRAD representa un avance significativo en la optimización de la IA, aprovechando las capacidades de los LLM para proporcionar comentarios detallados en lenguaje natural. Este enfoque permite una optimización eficiente y efectiva de sistemas complejos de IA, allanando el camino para el desarrollo de tecnologías de IA de próxima generación. Investigadores de la Universidad de Stanford y Chan Zuckerberg Biohub han demostrado que la flexibilidad y facilidad de uso de TEXTGRAD lo convierten en una herramienta poderosa para mejorar el rendimiento de la IA en varios dominios. Al automatizar el proceso de optimización, TEXTGRAD reduce la dependencia de ajustes manuales, acelerando el progreso de la investigación y las aplicaciones de IA.


Nikhil es consultor interno en Marktechpost. Está cursando una doble titulación integrada en Materiales en el Instituto Indio de Tecnología de Kharagpur. Nikhil es un entusiasta de la IA/ML que siempre está investigando aplicaciones en campos como los biomateriales y la ciencia biomédica. Con una sólida formación en ciencia de materiales, está explorando nuevos avances y creando oportunidades para contribuir.