¿Cómo diseñar una arquitectura MLOps en AWS?  |  por Harminder Singh

Una guía para desarrolladores y arquitectos, especialmente aquellos que no están especializados en aprendizaje automático, para diseñar una arquitectura MLOps para su organización.

Introducción

Según los hallazgos de Gartner, solo el 53% de los proyectos de aprendizaje automático (ML) avanzan desde la prueba de concepto (POC) hasta la producción. A menudo existe una desalineación entre los objetivos estratégicos de la empresa y los modelos de aprendizaje automático creados por científicos de datos. Puede haber una falta de comunicación entre DevOps, seguridad, asuntos legales, TI y el científico de datos, lo que genera desafíos para llevar el modelo a producción. Finalmente, al equipo podría resultarle difícil mantener los modelos en producción mientras lanza nuevos modelos. Ha llevado al surgimiento de MLOps, que incorpora los principios de DevOps, como la integración continua y la entrega continua (CI/CD), la automatización y la colaboración al ciclo de vida del aprendizaje automático: desarrollo, implementación y monitoreo.

En este artículo, profundizaré en lo siguiente:

  • Varios pasos en el proceso de aprendizaje automático.
  • Diferentes componentes de MLOps y explica por qué son necesarios sin profundizar demasiado en los detalles que solo los científicos de datos necesitan saber.
  • Diagramas de arquitectura MLOps basados ​​en el tamaño y madurez de la organización.
  • Sugerencias generales sobre cómo iniciar el viaje MLOps

Proceso típico de aprendizaje automático

Comencemos primero por comprender los pasos involucrados en el proceso de aprendizaje automático.

Proceso de aprendizaje automático — Imagen del autor

Un proceso de aprendizaje automático tiene los siguientes componentes:

  1. Planteamiento del problema empresarial y del aprendizaje automático: Comenzamos el proceso identificando el problema empresarial y acordando que el aprendizaje automático es la solución adecuada para el problema. La solución de aprendizaje automático propuesta debería producir un resultado empresarial mensurable.
  2. Recopilación, integración y limpieza de datos: En este paso, los científicos/ingenieros de datos recopilan datos, los integran con diferentes fuentes, los limpian y transforman para que estén listos para el consumo. Datos…