1nlnckkim4ctuyxfmezlbja.jpeg

Análisis de faltas y métodos de evaluación para la imputación de secuencias cortas y largas.

Foto por Willian Justén de Vasconcellos en desempaquetar

tEl tiempo es el continuo mejor definido en física y, por tanto, en la naturaleza. No debería sorprender, entonces, la importancia de la continuidad en los conjuntos de datos de series temporales: una secuencia cronológica de observaciones.

Este concepto por sí solo impulsa la motivación detrás de este artículo. Los conjuntos de datos del mundo real son susceptibles a valores faltantes por diversas razones, como sensores defectuosos, fallas en la ingesta de datos o simplemente la ausencia de información durante un tiempo determinado. Sin embargo, eso no cambia la naturaleza subyacente del proceso de generación de datos de sus funciones.

Por lo tanto, comprender qué causó esas interrupciones y analizarlas y manejarlas en un conjunto de datos de series temporales es fundamental para cualquier tarea posterior.

Tabla de contenido

El objetivo de este artículo

Después de análisis exploratorio integral de su serie temporal, es posible que descubra que los valores faltantes están presentes en una medida considerable. Al buscar comprender la naturaleza de sus datos, debería poder diferenciar una brecha que representa una falta de una brecha que implica una interrupción real, caracterizándola como una serie intermitente.

Este artículo se centrará en el primer escenario: Análisis de valores faltantes y métodos para evaluar los resultados de la imputación.. Si bien las técnicas reales para realizar la imputación son muchas [1][2]daré más detalles sobre …