Una guía para desarrolladores y arquitectos, especialmente aquellos que no están especializados en aprendizaje automático, para diseñar una arquitectura MLOps para su organización.
Introducción
Según los hallazgos de Gartner, solo el 53% de los proyectos de aprendizaje automático (ML) avanzan desde la prueba de concepto (POC) hasta la producción. A menudo existe una desalineación entre los objetivos estratégicos de la empresa y los modelos de aprendizaje automático creados por científicos de datos. Puede haber una falta de comunicación entre DevOps, seguridad, asuntos legales, TI y el científico de datos, lo que genera desafíos para llevar el modelo a producción. Finalmente, al equipo podría resultarle difícil mantener los modelos en producción mientras lanza nuevos modelos. Ha llevado al surgimiento de MLOps, que incorpora los principios de DevOps, como la integración continua y la entrega continua (CI/CD), la automatización y la colaboración al ciclo de vida del aprendizaje automático: desarrollo, implementación y monitoreo.
En este artículo, profundizaré en lo siguiente:
- Varios pasos en el proceso de aprendizaje automático.
- Diferentes componentes de MLOps y explica por qué son necesarios sin profundizar demasiado en los detalles que solo los científicos de datos necesitan saber.
- Diagramas de arquitectura MLOps basados en el tamaño y madurez de la organización.
- Sugerencias generales sobre cómo iniciar el viaje MLOps
Proceso típico de aprendizaje automático
Comencemos primero por comprender los pasos involucrados en el proceso de aprendizaje automático.
Un proceso de aprendizaje automático tiene los siguientes componentes:
- Planteamiento del problema empresarial y del aprendizaje automático: Comenzamos el proceso identificando el problema empresarial y acordando que el aprendizaje automático es la solución adecuada para el problema. La solución de aprendizaje automático propuesta debería producir un resultado empresarial mensurable.
- Recopilación, integración y limpieza de datos: En este paso, los científicos/ingenieros de datos recopilan datos, los integran con diferentes fuentes, los limpian y transforman para que estén listos para el consumo. Datos…