Falso profeta: un modelo de regresión de series temporales

Tomando prestadas ideas de Meta’s Prophet para construir un poderoso modelo de regresión de series temporales

Foto por Niklas Rhöse en desempaquetar

En este artículo de seguimiento, continúo mi misión de construir el monstruo de series temporales de Frankenstein combinando ideas del popular paquete Prophet¹ y la charla “Ganar con modelos simples, incluso lineales”².

Después de recordar lo que estamos haciendo, abordaremos el modelo de regresión: qué es y por qué es especial.

Luego pasaremos al ajuste de hiperparámetros utilizando validación cruzada de series temporales para obtener una parametrización “óptima” del modelo.

Finalmente, validaremos el modelo usando SHAP antes de aprovechar el formulario del modelo para permitir investigaciones personalizadas y ajustes manuales.

Hay mucho terreno por recorrer; pongámonos manos a la obra.

Aparte: cubrimos la preparación de datos subyacente y la ingeniería de características en un artículo anterior, por lo que vamos directamente al modelado. Ponte al día con lo que pasó allí:

Recordemos lo que estamos haciendo.

El objetivo final es simple: generar el pronóstico más preciso de eventos futuros en un horizonte temporal específico.

Empezamos desde cero con una serie temporal que contiene sólo una variable de fecha y la cantidad de interés. A partir de esto, derivamos características adicionales que nos ayudan a modelar resultados futuros con precisión; estos estaban fuertemente “inspirados” por el enfoque de Prophet.

Eso nos lleva a donde estamos ahora: listos para introducir nuestros datos de ingeniería en un modelo liviano, entrenándolo para pronosticar el futuro. Más adelante profundizaremos en el funcionamiento interno del modelo.

Recordemos cómo se ven los datos antes de continuar.

Estamos utilizando datos del mundo real del Reino Unido; en este caso, el conjunto de datos de accidentes de tráfico STATS19 que…