Cómo creé un proyecto de ciencia de datos siguiendo el ciclo de vida CRISP-DM | de Gustavo Santos | noviembre de 2024

Un proyecto de principio a fin que utiliza el marco CRISP-DM

Imagen creada por IA. OpenAI. Marco del ciclo de vida del proyecto CRISP-DM para ciencia de datos. DALL-E, 2024.

CRISP-DM significa Proceso estándar intersectorial para minería de datosun marco de minería de datos abierto a cualquiera que quiera utilizarlo.

Su primera versión fue creada por SPSS, Daimler-Benz y NCR. Luego, un grupo de empresas lo desarrolló y evolucionó a CRISP-DM, que hoy en día es uno de los marcos más conocidos y adoptados en ciencia de datos.

El proceso consta de 6 fases y es flexible. Es más como un organismo vivo donde puedes (y probablemente deberías) ir y venir entre las fases, iterando y mejorando los resultados.

Las fases son:

Comprensión empresarial

Comprensión de datos

Preparación de datos

Modelado

Evaluación

Despliegue

Las flechas pequeñas muestran un camino natural desde la comprensión empresarial hasta la implementación, donde las interacciones ocurren directamente, mientras que el círculo denota una relación cíclica entre las fases. Esto significa que el proyecto no termina con la implementación, sino que puede reiniciarse debido a nuevas preguntas comerciales provocadas por el proyecto o…