Cómo utilizar la búsqueda híbrida para recuperar mejor los RAG de LLM | por el Dr. Leon Eversberg

Cómo utilizar la búsqueda híbrida para recuperar mejor los RAG de LLM | por el Dr. Leon Eversberg | agosto de 2024

Construcción de una línea de trabajo LLM RAG local avanzada mediante la combinación de incrustaciones densas con BM25

Fragmento de código de la búsqueda híbrida que vamos a implementar en este artículo. Imagen del autor

La secuencia básica de recuperación-generación aumentada (RAG) utiliza un modelo de codificador para buscar documentos similares cuando se le realiza una consulta.

Esto también se llama búsqueda semántica porque el codificador transforma el texto en una representación vectorial de alta dimensión (llamada incrustación) en la que textos semánticamente similares están próximos entre sí.

Antes de que tuviéramos modelos de lenguaje grandes (LLM) para crear estas incrustaciones vectoriales, el algoritmo BM25 era un algoritmo de búsqueda muy popular. BM25 se centra en palabras clave importantes y busca coincidencias exactas en los documentos disponibles. Este enfoque se denomina Búsqueda por palabras clave.

Si desea llevar su canalización RAG al siguiente nivel, es posible que desee probar búsqueda híbridaLa búsqueda híbrida combina los beneficios de la búsqueda por palabras clave y la búsqueda semántica para mejorar la calidad de la búsqueda.

En este artículo, cubriremos la teoría e implementaremos los tres enfoques de búsqueda en Python.

Tabla de contenido

· Recuperación de RAG
∘ Búsqueda de palabras clave con BM25
∘ Búsqueda semántica con incrustaciones densas
∘ ¿Búsqueda semántica o búsqueda híbrida?
∘ Búsqueda híbrida
∘ Poniéndolo todo junto
·…

Cómo utilizar la búsqueda híbrida para recuperar mejor los RAG de LLM | por el Dr. Leon Eversberg | agosto de 2024

ByEquipo de 7 minutos

Construcción de una línea de trabajo LLM RAG local avanzada mediante la combinación de incrustaciones densas con BM25

Tabla de contenido

By Equipo de 7 minutos

Related Post

OpenAI lanza filtro de privacidad: un modelo de redacción de PII de código abierto de 1,500 millones de parámetros con 50 millones de parámetros activos

Conozca Talkie-1930: un LLM de peso abierto 13B capacitado en textos en inglés anteriores a 1931 para el razonamiento histórico y la investigación de generalización

¡Correlación no significa causalidad! ¿Pero qué significa?

You missed

La violación de datos del biobanco del Reino Unido expone riesgos en la Ley de datos (uso y acceso) de 2025

Cambios en las pensiones estatales del Reino Unido en mayo: lo que los expatriados británicos deben saber – The Leader

OpenAI lanza filtro de privacidad: un modelo de redacción de PII de código abierto de 1,500 millones de parámetros con 50 millones de parámetros activos

Starbirth se cierra a 40.000 años luz del núcleo de la Vía Láctea, y los astrónomos no saben por qué