Parte 1: Aprovechar la regresión lineal y los árboles de decisión para imputar brechas en las series de tiempo.
Datos faltantes en el análisis de series temporales — ¿Te suena familiar?
¿Le resulta demasiado familiar la falta de datos en sus conjuntos de datos debido a un mal funcionamiento de los sensores, la transmisión o cualquier tipo de mantenimiento?
Bueno, los valores faltantes descarrilan su pronóstico y distorsionan su análisis.
Entonces, ¿cómo se solucionan?
Métodos tradicionales puede parecer la solución: relleno directo o interpolación: pero ¿es eso lo suficientemente bueno??
¿Qué sucede cuando sus datos tienen patrones complejos, tendencias no lineales o alta variabilidad? Las técnicas simples fallarían y producirían resultados inestables.
¿Y si hubiera formas más sabias de afrontar este desafío?
El aprendizaje automático hace precisamente eso: desde análisis de regresión pasando por K-Vecinos más cercanos hasta redes neuronales, que no suponen nada más que adaptarse y rellenar los huecos con precisión.
¿Curioso? Veamos más a fondo cómo esos métodos avanzados cambiarán su análisis de series temporales.
Atribuiremos los datos faltantes al utilizar un conjunto de datos que usted mismo puede generar fácilmente…