Potente análisis y trazado de datos a través de solicitudes de lenguaje natural al brindar a los LLM acceso a bibliotecas | de LucianoSphere (Luciano Abriata, PhD)

Potente análisis y trazado de datos a través de solicitudes de lenguaje natural al brindar a los LLM acceso a bibliotecas | de LucianoSphere (Luciano Abriata, PhD) | enero de 2024

Recientemente comencé a explorar cómo usar modelos de lenguaje grandes (LLM) para automatizar el análisis de datos de modo que pueda hacerles preguntas sobre un conjunto de datos en forma natural y ellos respondan generando y ejecutando código. Implementado todo esto como una aplicación web, yo (¡y usted!) pudimos probar el poder y las limitaciones de este enfoque, confiando por el momento completamente en el programa que escribe JavaScript estándar:

Como explico en ese artículo, mi principal interés es abordar esta pregunta:

¿Puedo hacer preguntas a un LLM sobre un conjunto de datos con mis propias palabras y hacer que interprete estas preguntas con las matemáticas o secuencias de comandos necesarias para responderlas?

Después de las diversas pruebas allí informadas, identifiqué varias limitaciones que, sinceramente, excluyen las aplicaciones más interesantes. Es decir, si bien tanto GPT-3.5-turbo como GPT-4 demuestran comprensión de las consultas de los usuarios y pueden generar código adecuado para diversas tareas de análisis de datos, surgen desafíos al lidiar con operaciones matemáticas complejas y solicitudes de cierta complejidad. Y no me refiero a una complejidad muy alta; por ejemplo, ambos LLM pudieron producir código correcto para ejecutar regresión lineal, pero fallaron en ajustes cuadráticos y se perdieron por completo al intentar implementar procedimientos como el análisis de componentes principales (PCA). Lo peor es que a menudo ni siquiera se “daban cuenta” de que la tarea era demasiado para ellos, alucinando con un código que parecía correcto en un pase rápido (por ejemplo, el procedimiento PCA intentó invocar la descomposición en valores singulares, SVD) y a veces no lo hacía. Ni siquiera chocó, pero estuvo completamente equivocado.

Potente análisis y trazado de datos a través de solicitudes de lenguaje natural al brindar a los LLM acceso a bibliotecas | de LucianoSphere (Luciano Abriata, PhD) | enero de 2024

ByEquipo de 7 minutos

By Equipo de 7 minutos

Related Post

Anthropic desactiva Claude Fable 5 y Mythos 5 después de una orden del gobierno de EE. UU.

¿Es el lenguaje visual? Un experimento con caracteres chinos

Moonshot AI lanza Kimi K2.7-Code: un modelo de codificación que reporta un +21,8 % en Kimi Code Bench v2 sobre K2.6

You missed

Anthropic desactiva Claude Fable 5 y Mythos 5 después de una orden del gobierno de EE. UU.

¿Cómo pueden los jugadores de fútbol doblar sus tiros en el aire?

El líder del PP asume el fin del sanchismo: “Su epitafio está ya escrito: PS, las siglas de un fariseo que no cumplió nada de lo que prometió”

Con el gobierno furioso contra la autoridad aeroportuaria, el número de pasajeros de Palma aumentó un cinco por ciento en mayo