IncarnaMind: una herramienta de inteligencia artificial que te permite chatear con tus documentos personales (PDF, TXT) utilizando modelos de lenguaje grandes (LLM) como GPT

IncarnaMind es líder en el campo de la inteligencia artificial, ya que permite a los usuarios interactuar con sus documentos personales, ya sea que estén en formato PDF o TXT. La necesidad de poder consultar documentos en lenguaje natural ha aumentado con la introducción de soluciones impulsadas por IA. Sin embargo, aún existen problemas, especialmente en lo que respecta a la precisión y la gestión del contexto, incluso con modelos sólidos como GPT. IncarnaMind ha abordado estos problemas mediante una arquitectura única destinada a mejorar la interacción entre el usuario y el documento.

La fragmentación de ventanas deslizantes y un mecanismo de recuperación de conjuntos son los dos componentes principales de IncarnaMind, y ambos son esenciales para una recuperación de información eficaz y eficiente de los documentos.

  1. Fragmentación de ventana deslizante: la fragmentación de ventana deslizante de IncarnaMind modifica dinámicamente el tamaño y la posición de la ventana, a diferencia de los métodos convencionales de generación aumentada de recuperación (RAG), que dependen de tamaños de fragmentos fijos. Según la complejidad de los datos y la consulta del usuario, esta técnica adaptativa garantiza que el sistema pueda lograr un equilibrio entre la obtención de información más completa y contextualmente rica y detalles más precisos. Este enfoque hace que el sistema sea mucho más capaz de analizar y comprender documentos complejos, lo que lo convierte en una herramienta eficaz para recuperar información detallada.
  1. Ensemble Retriever: este enfoque mejora las consultas aún más al integrar varias estrategias de recuperación. Ensemble Retriever mejora las respuestas del LLM al permitir que IncarnaMind clasifique de manera eficaz los datos de granularidad gruesa y fina en los documentos de verdad fundamental del usuario. Al garantizar que el material presentado sea preciso y relevante, esta estrategia de recuperación multifacética ayuda a aliviar el problema predominante de las alucinaciones factuales que se observan con frecuencia en los LLM.

Una de sus mayores ventajas es que IncarnaMind puede resolver algunos de los problemas persistentes que aún enfrentan otras tecnologías de interacción con documentos impulsadas por IA. Debido a que las herramientas tradicionales utilizan un tamaño de fragmento único para la recuperación de información, con frecuencia tienen problemas con diferentes niveles de complejidad de datos. Esto se soluciona mediante la técnica de fragmentación adaptativa de IncarnaMind, que permite una extracción de datos más precisa y pertinente modificando los tamaños de los fragmentos en función del contenido y el contexto del documento.

La mayoría de las técnicas de recuperación se centran en la recuperación precisa de datos o en la comprensión semántica. Estos dos factores se equilibran con el Ensemble Retriever de IncarnaMind, que garantiza respuestas que son semánticamente ricas y contextualmente apropiadas. La incapacidad de muchas soluciones actuales para consultar más de un documento a la vez restringe su uso en escenarios que involucran varios documentos. IncarnaMind elimina este obstáculo al permitir consultas de múltiples saltos sobre varios documentos a la vez, lo que proporciona una comprensión más completa e integrada de los datos.

IncarnaMind está diseñado para adaptarse y funcionar con muchos otros LLM, como la serie Llama2, Anthropic Claude y OpenAI GPT. El modelo Llama2-70b-chat, que ha demostrado el mejor rendimiento en términos de razonamiento y seguridad en comparación con otros modelos como GPT-4 y Claude 2.0, es el modelo para el que la herramienta está optimizada específicamente. Sin embargo, algunos usuarios pueden considerar que esto es un inconveniente, ya que la versión cuantificada Llama2-70b-gguf requiere más de 35 GB de RAM de GPU para ejecutarse. La API Together.ai, que admite llama2-70b-chat y otros modelos de código abierto, proporciona un sustituto viable en estas situaciones.

En conclusión, con IncarnaMind, la IA mejorará significativamente la forma en que los usuarios interactúan con sus documentos personales. Está bien posicionada para convertirse en una herramienta crucial para cualquiera que requiera una consulta de documentos precisa y contextualizada, ya que aborda cuestiones importantes en la recuperación de documentos y proporciona una sólida interoperabilidad con múltiples LLM.


Revisar la GitHubTodo el crédito por esta investigación corresponde a los investigadores de este proyecto. Además, no olvides seguirnos en Gorjeo y únete a nuestro Canal de Telegram y LinkedIn Gr¡Arriba!. Si te gusta nuestro trabajo, te encantará nuestro Boletin informativo..

No olvides unirte a nuestro Subreddit de más de 48 000 millones de usuarios

Encuentra lo próximo Seminarios web sobre IA aquí



Tanya Malhotra es una estudiante de último año de la Universidad de Estudios de Petróleo y Energía, Dehradun, que cursa BTech en Ingeniería Informática con una especialización en Inteligencia Artificial y Aprendizaje Automático.
Es una entusiasta de la ciencia de datos con un buen pensamiento analítico y crítico, junto con un gran interés en adquirir nuevas habilidades, liderar grupos y gestionar el trabajo de manera organizada.