No limites tu base de conocimiento de RAG solo a texto | por Marcos Santiago

No limites tu base de conocimiento de RAG solo a texto | por Marcos Santiago | Agosto, 2024

Roba este script de Python plug-n-play para implementar fácilmente imágenes en la base de conocimientos de tu chatbot

Foto de Nitish Meena en Dejar de salpicar

Al crear una base de conocimientos, un desafío habitual es convertir todo en texto sin formato. Esto puede resultar limitante cuando se trabaja con fuentes multimedia como diapositivas, archivos PDF, imágenes y más.

Entonces, ¿cómo podemos hacer un uso adecuado de los datos que no están en texto simple?

⛳ ¿No tienes una membresía mediana? Te puedo ayudar: usa este Enlace de artículo gratuitoPor favor considere irse reflejos, aplausos, seguiry comentarios ⛳

Gracias a los recientes avances en inteligencia artificial, ahora es más fácil y más barato que nunca. Al utilizar modelos de lenguaje grandes (LLM) con capacidades de visión, podemos transcribir miles de imágenes, no solo capturando el texto, sino también entendiendo cómo se relacionan los contenidos. Estos modelos pueden incluso describir objetos visuales dentro de una imagen si es necesario, lo que ofrece una transcripción mucho más rica y detallada que la que podría ofrecer el OCR.

Comenzaremos con estos tres sencillos pasos:

Recopilar datos:Reúna las imágenes que planea utilizar, asegurándose de que estén bien organizadas y no sobrecargadas con información.
Subir datos:Configure un depósito AWS S3 para almacenar sus imágenes, asegurándose de que el modelo de IA basado en la nube pueda…

No limites tu base de conocimiento de RAG solo a texto | por Marcos Santiago | Agosto, 2024

ByEquipo de 7 minutos

Roba este script de Python plug-n-play para implementar fácilmente imágenes en la base de conocimientos de tu chatbot

By Equipo de 7 minutos

Related Post

Nous Research lanza Hermes Desktop: una interfaz nativa multiplataforma para Hermes Agent v0.15.2 con salida de herramienta de transmisión

Investigadores del MIT enseñan modelos de IA a interpretar gráficos | Noticias del MIT

Los modelos OpenAI y Codex en Amazon Bedrock ya están disponibles de forma generalizada

You missed

Nous Research lanza Hermes Desktop: una interfaz nativa multiplataforma para Hermes Agent v0.15.2 con salida de herramienta de transmisión

El microbioma de Ötzi, el hombre de hielo asesinado, sigue activo

Reinventar el desperdicio de alimentos: 10 startups europeas que crean valor a partir de los restos de comida

Nerja a Motril en Tren?