Tutorial de Sklearn: Módulo 1. Tomé el MOOC oficial de sklearn… |  de Yoann Mocquin |  noviembre de 2023

Entre las bibliotecas de ML, scikit-learn es el marco de facto más simple y sencillo para aprender ML. Se basa en la pila científica (principalmente NumPy), se centra en algoritmos tradicionales pero poderosos como regresión lineal/máquinas de vectores de soporte/reducciones de dimensionalidad, y proporciona muchas herramientas para construir alrededor de esos algoritmos (como evaluación y selección de modelos, optimización de hiperparámetros, datos preprocesamiento y selección de funciones).

Pero su principal ventaja es, sin duda, su documentación y guía de usuario. Literalmente, puedes aprender casi todo desde el sitio web scikit-learn, con muchos ejemplos.

Tenga en cuenta que otros marcos populares son TensorFlow y PyTorch, pero tienen curvas de aprendizaje más pronunciadas y se centran en temas más complejos como la visión por computadora y las redes neuronales. Dado que este fue mi primer contacto real con ML, pensé en comenzar con sklearn.

Ya comencé a leer la documentación hace unos meses, pero estaba un poco perdido dado su tamaño. Si bien la documentación es enorme y está muy bien escrita, no estoy seguro de que la mejor manera de aprender scikit-learn sea seguir toda la documentación, una página tras otra.

La buena noticia, y lo que desencadenó mi intención de aprender más sobre scikit-learn, fue el inicio del MOOC “oficial” de scikit-learn, creado por el equipo actual de scikit-learn.

En esta serie intentaré resumir lo que aprendí de cada uno de los 6 módulos que componen el MOOC. Este es un excelente ejercicio para practicar mi memoria y resumir lo que aprendí, y una buena introducción para ti si quieres ponerte en contacto con sklearn.