Construir un canal de generación aumentada de recuperación (RAG) es fácil; construir uno que no sufra alucinaciones durante una auditoría 10-K es casi imposible. Para los desarrolladores del sector financiero, el enfoque RAG “estándar” basado en vectores (fragmentar texto y esperar lo mejor) a menudo resulta en una “sopa de texto” que pierde el contexto estructural vital de tablas y balances.
VectifyAI está intentando cerrar esta brecha con el lanzamiento de Mafin 2.5, un agente financiero multimodal, y PageIndex, un marco de código abierto que hace que la industria cambie hacia ‘Vectorless RAG’.
El problema: por qué Vector RAG fracasa en las finanzas
RAG tradicional se basa en la similitud semántica. Si pregunta sobre ‘Ingresos netos’, una base de datos vectorial busca fragmentos de texto que suenen como ingresos netos. Sin embargo, los documentos financieros dependen del diseño. Un número en una celda no tiene sentido sin su encabezado, y esos encabezados a menudo se eliminan durante la conversión tradicional de PDF a texto.
Esta es la trampa de ‘basura entra, basura sale’: incluso el LLM más inteligente no puede razonar correctamente si los datos de entrada han perdido su estructura jerárquica.
Mafin 2.5: Precisión a escala
Mafin 2.5 no es sólo un modelo perfeccionado; Es un motor de razonamiento que logró una precisión del 98,7 % en FinanceBench, superando significativamente a GPT-4o y Perplexity en tareas de recuperación financiera.
Lo que lo distingue de los desarrolladores es su integración nativa con fuentes de datos de alta fidelidad:
Acceso integral a la SEC: indexación directa de presentaciones 10-K, 10-Q y 8-K. Ganancias Intel: transcripciones de llamadas de ganancias históricas y en tiempo real. Datos de mercado: tickers en vivo en Russell 3000 y Nasdaq.
PageIndex: el paso a RAG ‘sin vector’
La ‘salsa secreta’ detrás de la precisión de Mafin 2.5 es PageIndex. PageIndex reemplaza las incrustaciones planas tradicionales con un índice de árbol jerárquico.
En lugar de buscar fragmentos aleatorios, PageIndex permite a un LLM ‘razonar’ a través de la estructura de un documento. Crea un árbol semántico, esencialmente un mapa inteligente del documento, que permite al agente identificar la sección, página y línea exacta requerida.
Las características técnicas clave incluyen:
Soporte nativo de Vision: PageIndex admite RAG basado en Vision, lo que permite a los modelos “ver” el diseño global de una página (gráficos, cuadrículas complejas) en lugar de depender únicamente del texto OCR. Navegación jerárquica: transforma los archivos PDF en una estructura de árbol navegable, asegurando que la relación entre los encabezados y los datos permanezca intacta. Trazabilidad: a diferencia de la “caja negra” de la similitud vectorial, cada respuesta tiene un camino claro a través del árbol de documentos, lo que proporciona una pista de auditoría muy necesaria para los entornos financieros regulados.
Conclusiones clave
Precisión financiera sin precedentes (98,7%): Mafin 2.5 ha establecido un nuevo récord de vanguardia en el punto de referencia FinanceBench, logrando una precisión del 98,7%. Esto supera significativamente a los modelos de propósito general como GPT-4o (~31%) y Perplexity (~45%) al centrarse en el razonamiento financiero especializado en lugar de la recuperación general. El cambio a ‘RAG sin vector’: alejándose de la búsqueda “basada en vibraciones” de las bases de datos vectoriales tradicionales, PageIndex presenta RAG basado en razonamiento. Utiliza un LLM para “razonar” su camino a través de la estructura de un documento, imitando cómo un analista humano navega por un informe para encontrar puntos de datos específicos. Indexación jerárquica de ‘árbol’ versus fragmentación: en lugar de dividir documentos en fragmentos de texto arbitrarios y sin contexto, PageIndex organiza los archivos PDF en una estructura de árbol semántica (una tabla de contenido inteligente). Esto preserva la relación crítica entre encabezados, tablas anidadas y notas al pie que el RAG tradicional a menudo destruye. Flujos de trabajo nativos de Vision y sin OCR: el marco es compatible con Vectorless RAG basado en Vision, lo que permite a la IA “ver” y recuperar información directamente de las imágenes de la página. Esto cambia las reglas del juego para los documentos financieros donde el diseño visual de un balance o una cuadrícula compleja es tan importante como los números mismos. Trazabilidad de nivel empresarial: a diferencia de la “caja negra” de similitud de vectores, PageIndex proporciona una ruta de razonamiento totalmente auditable. Cada respuesta está vinculada a nodos, páginas y secciones específicas, lo que proporciona la transparencia necesaria para el cumplimiento y las auditorías financieras de alto riesgo.
Consulte los detalles técnicos y el repositorio. Además, no dude en seguirnos en Twitter y no olvide unirse a nuestro SubReddit de más de 100.000 ML y suscribirse a nuestro boletín. ¡Esperar! estas en telegrama? Ahora también puedes unirte a nosotros en Telegram.

Michal Sutter es un profesional de la ciencia de datos con una Maestría en Ciencias de Datos de la Universidad de Padua. Con una base sólida en análisis estadístico, aprendizaje automático e ingeniería de datos, Michal se destaca en transformar conjuntos de datos complejos en conocimientos prácticos.