00ptj52ap43i3s1n3.jpeg
Foto por Tamara Gak en desempaquetar

Tutorial para principiantes en IA generativa: construyamos un sistema RAG (Generación Aumentada de Recuperación) muy simple localmente, paso a paso

A Generación aumentada de recuperación (TRAPO) el sistema es como un asistente inteligente que te ayuda. Imagina que estás escribiendo sobre un tema. Tienes algunos conocimientos en tu cabeza (como una IA generativa), pero es posible que no lo recuerdes todo. Entonces, buscas información en libros o en Internet (esta es la parte de “recuperación”). Una vez que haya encontrado la información correcta, la utilizará para escribir su informe con sus propias palabras (esta es la parte de “generación”). Entonces, un sistema RAG es una herramienta que combina su propio conocimiento (como su memoria) con la capacidad de buscar otras fuentes de información (como sus libros o notas), para generar (escribir) una respuesta o completar una tarea.

Normalmente, la complejidad y las exigencias de los sistemas RAG requieren el uso de potentes ordenadores o servicios en la nube. En este tutorial, vamos a construir una generación aumentada de recuperación muy simple. sistema localmente (es decir, sin servicios en línea durante la fase de funcionamiento), paso a paso, con marcos o herramientas de última generación. El procedimiento descrito aquí es fundamentalmente básico y difiere significativamente de los estándares industriales establecidos. El objetivo de este tutorial no es construir el sistema RAG definitivo, sino examinar cada componente con un poco de detalle para obtener una comprensión más profunda de la mecánica subyacente. Este artículo está dirigido a principiantes en el mundo GenAI. Cada fragmento de código que se muestra aquí también se informa en el Repositorio easyRAG GitHub.

¿Listo? ¡Vamos!

Usamos Anaconda en este tutorial. Si no lo tiene en su máquina, por favor, Descargalo desde el sitio web oficial e instálelo (simplemente siga las instrucciones del script de instalación).

Luego, dentro de una sesión de terminal, podemos comenzar a crear el entorno con algunos paquetes que usaremos durante el proceso.

conda create -n easyrag -c nvidia -c conda-forge -v python==3.9 cuda-toolkit==12.4.0 jupyterlab==4.1.4 ipywidgets==8.1.2 wikipedia==1.4.0 mypy==1.8.0 accelerate==0.27.0…