0 Ciyllwskas481bh.jpeg

Muchos científicos de datos abusan del aprendizaje automático y descuidan las técnicas de optimización matemática, a pesar de que es (a) excelente para su carrera y (b) fácil de aprender, incluso para alguien que no es Mathmo (como yo).

Imagen por Emilio García en desempaquetar

¿Quieres mi visión sobre el estado de la ciencia de datos en 2024? Aquí lo tienes:

Los científicos de datos están demasiado obsesionados con el aprendizaje automático.

Para alguien que tiene un martillo, cada problema parece un clavo; Para el científico de datos moderno, cada problema aparentemente parece un problema de aprendizaje automático. Nos hemos vuelto tan buenos traduciendo problemas al lenguaje del análisis y el aprendizaje automático que a veces olvidamos que existen otros enfoques científicos de datos. Y esto es una enorme vergüenza.

En este artículo, presentaré otra rama de la ciencia de datos: la optimización matemática (específicamente, Programación de restricciones)— y muestre cómo puede agregar valor a su carrera como científico de datos.

Si no tienes una sólida formación en matemáticas, no se deje intimidar por el nombre. Tampoco estudié Matemáticas en la universidad (estudié Geografía), pero me resultó sorprendentemente fácil iniciarme en las técnicas de Optimización Matemática gracias a la biblioteca Python de código abierto de Google. OR-Toolsque presentaré en este artículo para principiantes.

Si desea ampliar su conjunto de herramientas de ciencia de datos y aprender esta habilidad de alta demanda, ¡siéntese y abróchese el cinturón!

La optimización es un conjunto de técnicas para “encontrar[ing] la mejor solución a un problema entre un conjunto muy grande de soluciones posibles» (fuente: Desarrolladores de Google).

A veces, eso significa encontrar el óptimo solución a un problema; en otras ocasiones, simplemente significa encontrar todos los factible soluciones. Hay muchas situaciones en las que encontrará este tipo de problemas, por ejemplo:

  1. Imagine que está trabajando en el equipo de ciencia de datos de su almacén local de Amazon. Hay 100 paquetes para entregar, 3 conductores de entrega y todas las entregas deben realizarse dentro de un período de 2 horas. Este es un ejemplo de una problema de optimizacióndonde necesitas…