0 Ifaupnsj Vxevw.jpeg

Los proyectos de ciencia de datos a menudo implican desarrollar modelos de aprendizaje automático (ML) para resolver problemas empresariales. Si bien esto puede parecer algo común en los negocios hoy en día, todavía conlleva varios riesgos.

Es decir, el desarrollo de modelos de ML es inherentemente incierto, técnicamente exigente, costoso y requiere mucho tiempo. Estos riesgos motivan los marcos de gestión de proyectos diseñados específicamente para proyectos de ciencia de datos.

Aquí describiré uno de esos enfoques y desglosaré las contribuciones clave de un director de proyecto en este contexto.

El enfoque que me gusta utilizar para proyectos de ciencia de datos se describe en el marco de cinco pasos que se ilustra a continuación.

Mi marco de gestión de proyectos de ciencia de datos de 5 pasos. Imagen del autor.

Profundizando más, aquí hay algunas actividades clave para cada fase.

  • Fase 0: Definición y alcance del problema — Formular el problema empresarial. Diseñar la solución de ciencia de datos. Defina los hitos del proyecto, las tareas y las métricas de éxito. Papel clave: Gerente de proyecto
  • Fase 1: Adquisición, exploración y preparación de datos — Evaluar los datos disponibles. Adquirir y explorar datos. Desarrollar canales de datos. Papeles clave: Ingeniero de datos, Científico de datos
  • Fase 2: Desarrollo de soluciones — Desarrollar una solución de aprendizaje automático. Evaluar la validez y el valor de la solución. Itere con las partes interesadas y revise las fases pasadas según sea necesario. Papel clave: Científico de datos
  • Fase 3: Implementación de la solución — Integrar la solución en el contexto empresarial del mundo real. Desarrollar un proceso de monitoreo de soluciones. Papeles clave: Ingeniero de aprendizaje automático, científico de datos
  • Fase 4: Evaluación y documentación — Evaluar los resultados del proyecto. Entregar documentación técnica y guías de usuario. Reflexionar sobre las lecciones aprendidas y el trabajo futuro. Papel clave: Gerente de proyecto

Un punto importante aquí es que los proyectos de ciencia de datos a menudo no avanzan linealmente a través de cada una de estas fases. Más bien, se requiere cierta cantidad de iteración a través de bucles de retroalimentación clave. A continuación se muestran algunos ejemplos de cómo podría verse esto.

  • Fase 1 → Fase 0: Al explorar los datos disponibles, queda claro que no hay información clave disponible y que se debe revisar el plan del proyecto.
  • Fase 2 → Fase 1: Después de entrenar varios modelos, se descubre que una excepción no se manejó adecuadamente en la preparación de datos.
  • Fase 2 → Fase 0: Los modelos preliminares no demuestran un rendimiento predictivo sólido, lo que requiere reevaluar el valor del proyecto.
  • Fase 4 → Fase 0: Todo proyecto tiene sus oportunidades de mejora. Al finalizar, los equipos pueden evaluar estas oportunidades e iniciar otro proyecto, comenzando con la Fase 0.

El director del proyecto (PM) es responsable final del éxito de un proyecto. Si el proyecto se retrasa, es responsabilidad del primer ministro. Si los costos exceden las estimaciones, será responsabilidad del PM. Si el valor no cumple con las expectativas, depende del PM.

Si bien esta responsabilidad implica una amplia gama de tareas de múltiples contribuyentes, Un determinante clave del éxito de un proyecto. es la ejecución por parte del PM de la Fase 0 (como se describe anteriormente).

La fase 0 sienta las bases de un proyecto de ciencia de datos. Así como una base mal construida resultará en un proyecto de construcción difícil, una Fase 0 mal ejecutada resultará en un proyecto de ciencia de datos difícil.

Los 3 elementos clave de la Fase 0 incluyen el diagnóstico de problemas, el diseño de la solución y el plan de implementación. [1].

1) Diagnóstico de problemas

De los 3 elementos, este es el más crítico porque si te equivocas, puedes gastar mucho tiempo y dinero. resolviendo el problema equivocado (es decir, se genera poco valor). A pesar de su importancia, muchos tienden a pasarlo por alto (si no a saltárselo por completo), tomándose el tiempo para detenerse y pensar en el problema empresarial.

Así como un médico entrevista a un paciente para elaborar un diagnóstico, un PM entrevista a las partes interesadas para comprender mejor el problema empresarial e identificar la causa raíz. Aunque hay muchas maneras de hacer esto, me gusta mantener las cosas simples y concentrarme en preguntar dos preguntas clave.

  1. ¿Que problema estas tratando de resolver? — este es siempre el mejor punto de partida para estas conversaciones [1]
  2. ¿Por qué es eso importante para el negocio? — esto puede iniciar una serie de 5 preguntas basadas en por qué para llegar a la causa raíz del problema (consulte El enfoque de los 5 porqués de Toyota) [2]

Una de las habilidades más importantes del primer ministro es colaborar eficazmente con las partes interesadas para comprender sus problemas. Hablo de esto más a fondo en un artículo pasado.

2) Diseño de solución

Una vez que se comprende claramente el problema empresarial, el siguiente paso es definir cómo solucionarlo. Varias soluciones en varios niveles de complejidad. puede abordar cualquier problema dado.

Por ejemplo, si la rotación de clientes es alta debido a un proceso de incorporación lento, algunas soluciones potenciales podrían ser eliminar pasos de incorporación innecesarios, analizar dónde se produce la baja y reelaborar ese paso, personalizar la incorporación en función de la información del cliente, etc. Tenga en cuenta que estas soluciones pueden No requiere aprendizaje automático (y eso está bien).

Supongamos que, después de muchos intercambios, la parte interesada quiere seguir adelante con el desarrollo de una experiencia de incorporación personalizada basada en los perfiles de los clientes. Si bien esto reduce las cosas, esta solución aún se puede implementar de muchas maneras. Por lo tanto, la El primer ministro debe usar su criterio para proponer una solución. basado en conversaciones con las partes interesadas, proyectos industriales similares y recursos disponibles.

3) Plan de implementación

El elemento final de la Fase 0 es traducir la solución propuesta en un plan concreto de implementación del proyecto. Este plan consta de dos piezas clave: una hoja de ruta del proyecto y los requisitos del proyecto.

A hoja de ruta del proyecto consta de hitos clave del proyecto. Me gusta basar estos hitos en las Fases 1 a 4, como se describe anteriormente. Cada fase consta de tareas asignadas a una función particular (p. ej., ingeniero de datos, científico de datos o ingeniero de ML) y una fecha de vencimiento. [1].

Requerimientos del proyecto especifique todos los recursos necesarios para la implementación, incluidos los requisitos de datos, roles clave, herramientas de software e infraestructura informática.

Revisaré la Fase 0 para ver un estudio de caso de ejemplo para solidificar estas ideas. Si bien esto pretende ser instructivo, es un proyecto real que implementaré (y documentaré) en futuros artículos de esta serie.

🔗 Lista de lectura de la serie | Lista de reproducción de YouTube