Ingeniería rápida para análisis de series temporales

En este artículo, aprenderá patrones prácticos de ingeniería rápida que hacen que los modelos de lenguaje grandes sean útiles y confiables para el análisis y el pronóstico de series temporales.

Los temas que cubriremos incluyen:

Cómo enmarcar el contexto temporal y extraer señales útiles Cómo combinar el razonamiento LLM con modelos estadísticos clásicos Cómo estructurar datos e indicaciones para pronósticos, anomalías y restricciones de dominio

Sin más dilación comencemos.

Ingeniería rápida para análisis de series temporales
Imagen del editor

Introducción

Por extraño que parezca, los modelos de lenguaje grande (LLM) se pueden aprovechar para tareas de análisis de datos, incluidos escenarios específicos como el análisis de series temporales. La clave es traducir correctamente sus habilidades de ingeniería inmediatas al escenario de análisis específico.

Este artículo describe siete estrategias de ingeniería rápida que se pueden utilizar para aprovechar las tareas de análisis de series de tiempo con LLM.

A menos que se indique lo contrario, las descripciones de estas estrategias van acompañadas de ejemplos ilustrativos que giran en torno a un escenario de datos de ventas minoristas, en concreto, considerando para su análisis un conjunto de datos de series temporales que consiste en ventas diarias a lo largo del tiempo.

1. Contextualizar la estructura temporal

En primer lugar, un mensaje eficaz para obtener un resultado de modelo útil debe ser uno que le ayude a comprender la estructura temporal del conjunto de datos de series temporales. Esto incluye posibles menciones de tendencias al alza o a la baja, estacionalidad, ciclos conocidos como promociones o días festivos, etc. Esta información de contexto ayudará a su LLM a interpretar, por ejemplo, las fluctuaciones temporales como, bueno, simplemente eso: fluctuaciones, en lugar de ruido. En resumen, describir claramente la estructura del conjunto de datos en el contexto que acompaña a las indicaciones a menudo va más allá de las intrincadas instrucciones de razonamiento en las indicaciones.

Mensaje de ejemplo:
“Aquí están las ventas diarias (en unidades) de los últimos 365 días. Los datos muestran una estacionalidad semanal (mayores ventas los fines de semana), una tendencia a largo plazo que aumenta gradualmente y picos mensuales al final de cada mes debido a las promociones del día de pago. Utilice ese conocimiento al pronosticar los próximos 30 días”.

2. Extracción de funciones y señales

En lugar de pedirle a su modelo que realice pronósticos directos a partir de números sin procesar, ¿por qué no pedirle que extraiga algunas características clave primero? Esto podría incluir patrones latentes, anomalías y correlaciones. Pedirle al LLM que extraiga características y señales e las incorpore en el mensaje (por ejemplo, mediante estadísticas resumidas o descomposición) ayuda a revelar las razones detrás de predicciones o fluctuaciones futuras.

Mensaje de ejemplo:
“A partir de los datos de ventas de los últimos 365 días, calcule las ventas diarias promedio, la desviación estándar, identifique los días en los que las ventas excedieron la media más el doble de la desviación estándar (es decir, valores atípicos potenciales) y observe cualquier patrón semanal o mensual recurrente. Luego interprete qué factores podrían explicar los días de altas ventas o caídas, y señale cualquier anomalía inusual”.

3. LLM híbrido + flujo de trabajo estadístico

Seamos realistas: los LLM de forma aislada a menudo tendrán dificultades con tareas que requieren precisión numérica y capturar dependencias temporales en series de tiempo. Por esta razón, simplemente combinar su uso con modelos estadísticos clásicos es una fórmula para obtener mejores resultados. ¿Cómo podría definirse un flujo de trabajo híbrido como este? El truco consiste en inyectar razonamiento LLM (interpretación de alto nivel, formulación de hipótesis y comprensión del contexto) junto con modelos cuantitativos como ARIMA, ETS u otros.

Por ejemplo, LeMoLE (LLM-Enhanced Mixture of Linear Experts) es un ejemplo de un enfoque híbrido que enriquece los modelos lineales con características derivadas de indicaciones.

El resultado combina razonamiento contextual y rigor estadístico: lo mejor de dos mundos.

4. Representación de datos basada en esquemas

Si bien los conjuntos de datos de series temporales sin procesar suelen ser formatos poco adecuados para pasar como entradas de LLM, el uso de esquemas estructurados como JSON o tablas compactas podría ser la clave que permita al LLM interpretar estos datos de manera mucho más confiable, como se demuestra en varios estudios.

Ejemplo de fragmento JSON que se pasará junto con un mensaje:

Solicite acompañar los datos JSON con:
“Teniendo en cuenta los datos y metadatos JSON anteriores, analice la serie temporal y pronostique las ventas de los próximos 30 días”.

5. Patrones de pronóstico solicitados

Diseñar y estructurar adecuadamente patrones de pronóstico dentro del mensaje (como horizontes de corto plazo versus horizontes de largo plazo o simular escenarios hipotéticos específicos) puede ayudar a guiar el modelo para producir respuestas más utilizables. Este enfoque es eficaz para generar conocimientos altamente procesables para el análisis solicitado.

Ejemplo:

6. Avisos de detección de anomalías

Esta es más específica de la tarea y se centra en elaborar indicaciones adecuadas que puedan ayudar no sólo a pronosticar con los LLM sino también a detectar anomalías (en combinación con métodos estadísticos) y razonar sobre sus causas probables, o incluso sugerir qué investigar. La clave es, una vez más, preprocesar primero con herramientas tradicionales de series de tiempo y luego solicitar al modelo la interpretación de los hallazgos.

Mensaje de ejemplo:
“Utilizando el JSON de datos de ventas, primero marque cualquier día en el que las ventas se desvíen más de 2 veces la desviación estándar semanal de la media semanal. Luego, para cada día marcado, explique las posibles causas (p. ej., falta de stock, promoción, eventos externos) y recomiende si se debe investigar (p. ej., verificar registros de inventario, campaña de marketing, tráfico presencial en la tienda)”.

7. Razonamiento basado en el dominio

El conocimiento de dominios, como los patrones de estacionalidad del comercio minorista, los efectos de las vacaciones, etc., descubre información valiosa e incorporarla en las indicaciones ayuda a los LLM a realizar análisis y predicciones que son más significativos y también interpretables. Esto se reduce a aprovechar la relevancia del “contexto del conjunto de datos”, tanto semántica como específica del dominio, como faro que guía el razonamiento del modelo.

Un mensaje como este podría ayudar al LLM a anticipar mejor los picos de fin de mes o caídas de ventas debido a los descuentos navideños:
“Estos son los datos de ventas diarias de una cadena minorista. Las ventas tienden a aumentar al final de cada mes (los clientes reciben salarios), caer en los días festivos y aumentar durante los eventos promocionales. También hay una escasez ocasional de existencias, lo que resulta en caídas para ciertos SKU. Utilice este conocimiento de dominio al analizar la serie y realizar pronósticos”.

Concluyendo

Este artículo describe siete estrategias diferentes, en gran medida fundadas y respaldadas por estudios recientes, para generar indicaciones más efectivas para el análisis de series de tiempo y las tareas de pronóstico con la ayuda de los LLM.