La guía definitiva para el análisis de datos estructurados con OpenAI GPT3.5 | de Marie Stephen Leo | abril de 2024

Porautomata

#abril, #análisis, #con, #datos, #definitiva, #estructurados, #GPT3.5, #guía, #LEO, #Marie, #OpenAI, #para, #Stephen

Comparación sistemática de Instructor, Fructose y Langchain para tres tareas complejas de análisis de datos estructurados del mundo real.

Imagen generada por el autor usando ChatGPT

Analizar datos estructurados de modelos de lenguajes grandes (LLM) puede resultar frustrante para cualquier cosa más allá de los problemas de los juguetes. Sin embargo, analizar de manera confiable los resultados de los LLM en estructuras predefinidas es crucial para integrar los LLM en otros sistemas de software y aplicaciones de IA generativa. OpenAI ha tomado la iniciativa al lanzar la llamada a la función GPT (Enlace) y modo JSON (Enlace). Aún así, estos requieren ingeniería rápida e intensiva, análisis sólido, reintentos y manejo elegante de errores para funcionar de manera confiable en problemas de producción del mundo real.

A continuación se detallan algunos problemas que he enfrentado al analizar datos estructurados con LLM. Este artículo fue escrito íntegramente por un humano con la ayuda del corrector gramatical de Grammarly, que ha sido mi método de escritura desde 2019.

Clasificación: El LLM debe cumplir estrictamente con una lista de clases permitidas, que pueden ser de decenas a cientos en problemas del mundo real. Los LLM comienzan a alucinar con clases no permitidas en tareas con más de un puñado de clases.
Reconocimiento de entidad nombrada (NER): El LLM solo debe seleccionar entidades presentes explícitamente en el texto. Estas entidades podrían estar en un 2…

Entrada relacionada

Inteligencia artificial

TRANSMI: un marco de aprendizaje automático para crear modelos de referencia adaptados para datos transliterados de modelos de lenguaje multilingües previamente entrenados mPLM sin ningún tipo de capacitación

May 20, 2024 automata

Inteligencia artificial

Cómo configurar una máquina Linux con múltiples GPU para aprendizaje profundo en 2024 | por Nika | mayo, 2024

May 20, 2024 automata

Inteligencia artificial

Este artículo sobre IA de Huawei presenta un marco teórico centrado en el proceso de memorización y la dinámica de rendimiento de los modelos de lenguaje basados en transformadores (LM)

May 19, 2024 automata

Porautomata

Comparación sistemática de Instructor, Fructose y Langchain para tres tareas complejas de análisis de datos estructurados del mundo real.

Entrada relacionada

Te has perdido