DualDistill y Agentic-R1: Cómo AI combina el lenguaje natural y el uso de herramientas para la resolución de problemas de matemáticas superiores
Los modelos existentes de razonamiento de long-st han alcanzado el rendimiento de vanguardia en el razonamiento matemático al generar trayectorias de razonamiento con autoverificación y refinamiento iterativo. Sin embargo, los…