Datos faltantes en series temporales: técnicas de aprendizaje automático | de Sara Nóbrega | diciembre de 2024

Parte 1: Aprovechar la regresión lineal y los árboles de decisión para imputar brechas en las series de tiempo.

Fuente: DALL-E.

Datos faltantes en el análisis de series temporales — ¿Te suena familiar?

¿Le resulta demasiado familiar la falta de datos en sus conjuntos de datos debido a un mal funcionamiento de los sensores, la transmisión o cualquier tipo de mantenimiento?

Bueno, los valores faltantes descarrilan su pronóstico y distorsionan su análisis.

Entonces, ¿cómo se solucionan?

Métodos tradicionales puede parecer la solución: relleno directo o interpolación: pero ¿es eso lo suficientemente bueno??

¿Qué sucede cuando sus datos tienen patrones complejos, tendencias no lineales o alta variabilidad? Las técnicas simples fallarían y producirían resultados inestables.

¿Y si hubiera formas más sabias de afrontar este desafío?

El aprendizaje automático hace precisamente eso: desde análisis de regresión pasando por K-Vecinos más cercanos hasta redes neuronales, que no suponen nada más que adaptarse y rellenar los huecos con precisión.

¿Curioso? Veamos más a fondo cómo esos métodos avanzados cambiarán su análisis de series temporales.

Atribuiremos los datos faltantes al utilizar un conjunto de datos que usted mismo puede generar fácilmente…