FIN-R1: un modelo de lenguaje grande especializado para el razonamiento financiero y la toma de decisiones

Los LLM están avanzando rápidamente en múltiples dominios, sin embargo, su efectividad para abordar problemas financieros complejos sigue siendo un área de investigación activa. El desarrollo iterativo de LLM ha impulsado significativamente la evolución de la inteligencia artificial hacia la inteligencia general artificial (AGI). La serie O1 de OpenAI y modelos similares como QWQ y Marco-O1 han mejorado las capacidades de razonamiento complejas al extender el razonamiento de “cadena de pensamiento” a través de un enfoque iterativo de “reflexión de exploración”. En finanzas, modelos como Xuanyuan-Finx1-previa y Fino1 han mostrado el potencial de LLM en tareas de razonamiento cognitivo. Mientras tanto, Deepseekr1 adopta una estrategia diferente, confiando únicamente en RL con capacitación en varias etapas para mejorar el razonamiento y las habilidades de inferencia. Al combinar miles de pasos de entrenamiento RL no supervisados ​​con un pequeño conjunto de datos de arranque en frío, Deepseekr1 demuestra un fuerte rendimiento de razonamiento emergente y una legibilidad, destacando la efectividad de las metodologías basadas en RL en la mejora de los modelos de idiomas a gran escala.

A pesar de estos avances, los LLM de uso general luchan por adaptarse a tareas de razonamiento financiero especializados. La toma de decisiones financieras requiere un conocimiento interdisciplinario, incluidas las regulaciones legales, los indicadores económicos y el modelado matemático, al tiempo que exige un razonamiento lógico, paso a paso. Surgen varios desafíos al implementar LLM en aplicaciones financieras. Primero, los datos financieros fragmentados complican la integración del conocimiento, lo que lleva a inconsistencias que obstaculizan la comprensión integral. En segundo lugar, la naturaleza de la caja negra de LLM hace que su proceso de razonamiento sea difícil de interpretar, en conflicto con los requisitos reglamentarios para la transparencia y la responsabilidad. Finalmente, los LLM a menudo luchan con la generalización en los escenarios financieros, produciendo resultados poco confiables en aplicaciones de alto riesgo. Estas limitaciones plantean barreras significativas para su adopción en los sistemas financieros del mundo real, donde la precisión y la trazabilidad son críticas.

Investigadores de la Universidad de Finanzas y Economía de Shanghai, la Universidad de Fudan y Finstep han desarrollado FIN-R1, una LLM especializada para el razonamiento financiero. Con una arquitectura compacta de 7 mil millones de parámetros, FIN-R1 reduce los costos de implementación al tiempo que aborda los desafíos económicos clave: datos fragmentados, falta de control de razonamiento y generalización débil. Está capacitado en datos FIN-R1, un conjunto de datos de alta calidad que contiene 60,091 cot procedentes de datos financieros autorizados. Un enfoque de entrenamiento en dos etapas, ajuste fino (SFT) supervisado seguido de RL, FIN-R1 mejora la precisión e interpretabilidad. Se desempeña bien en los puntos de referencia financieros, sobresaliendo en el cumplimiento financiero y las aplicaciones de robo-advisory.

El estudio presenta un marco de dos etapas para construir FIN-R1. La fase de generación de datos implica crear un conjunto de datos de razonamiento financiero de alta calidad, datos FIN-R1, a través de la destilación de datos con Deepseek-R1 y filtrado utilizando un enfoque de LLM-as-Judge. En la fase de entrenamiento del modelo, FIN-R1 se ajusta a FIN en el instructo QWEN2.5-7B utilizando SFT y la optimización de políticas relativas del grupo (GRPO) para mejorar el razonamiento y la consistencia de salida. El conjunto de datos combina datos financieros de código abierto y patentados, refinados a través del filtrado riguroso. La capacitación integra el aprendizaje supervisado y el aprendizaje de refuerzo, incorporando indicaciones estructuradas y mecanismos de recompensa para mejorar la precisión y la estandarización del razonamiento financiero.

Las habilidades de razonamiento de FIN-R1 en escenarios financieros se evaluaron a través de un análisis comparativo contra varios modelos de última generación, incluidos Deepseek-R1, FIN-R1-SFT y varias arquitecturas basadas en Qwen y Llama. A pesar de su tamaño de parámetro 7B compacto, FIN-R1 logró un puntaje promedio notable de 75.2, clasificando el segundo en general. Superó a todos los modelos de escala similar y excedió Deepseek-R1-Distill-Llama-70B por 8.7 puntos. FIN-R1 se clasificó más alto en Finqa y Convfinqa con puntajes de 76.0 y 85.0, respectivamente, demostrando un fuerte razonamiento financiero y generalización de tareas cruzadas, particularmente en puntos de referencia como Ant_Finance, TFNS y Finance-Instructo-500K.

En conclusión, FIN-R1 es un gran modelo de lenguaje de razonamiento financiero diseñado para abordar los desafíos clave en la IA financiera, incluidos los datos fragmentados, la lógica de razonamiento inconsistente y la generalización comercial limitada. Ofrece un rendimiento de última generación al utilizar un proceso de capacitación en dos etapas, SFT y RL, en el conjunto de datos de datos FIN-R1 de alta calidad. Con una escala de parámetros 7b compacta, logra puntajes de 85.0 en convfinqa y 76.0 en FINQA, superando los modelos más grandes. El trabajo futuro tiene como objetivo mejorar las capacidades multimodales financieras, fortalecer el cumplimiento regulatorio y ampliar las aplicaciones del mundo real, impulsar la innovación en FinTech al tiempo que garantiza la toma de decisiones financieras eficientes e inteligentes.


    Verificar el Papel y Modelo en la cara abrazada. Todo el crédito por esta investigación va a los investigadores de este proyecto. Además, siéntete libre de seguirnos Gorjeo Y no olvides unirte a nuestro 85k+ ml de subreddit.


    Sana Hassan, una pasante de consultoría en MarktechPost y estudiante de doble grado en IIT Madras, le apasiona aplicar tecnología e IA para abordar los desafíos del mundo real. Con un gran interés en resolver problemas prácticos, aporta una nueva perspectiva a la intersección de la IA y las soluciones de la vida real.