Los modelos ficticios de Scikit-learn.  Ten siempre un chupete a tu lado.  |  de Yoann Mocquin |  febrero de 2024

Si te gusta o quieres aprender aprendizaje automático con scikit-learn, consulta mi serie de tutoriales sobre este increíble paquete:

Tutorial de Sklearn

Todas las imágenes por autor.

Los modelos ficticios son modelos muy simplistas que deben usarse como base para comparar los modelos reales. Una línea de base es sólo una especie de punto de referencia con el que compararse. Cuando calcula sus primeros resultados de validación cruzada para estimar el rendimiento de su modelo, normalmente sabe que cuanto mayor sea la puntuación, mejor, y si la puntuación es bastante alta en el primer intento, es fantástico. Pero no suele ser así.

¿Qué hacer si la primera puntuación de precisión es bastante baja, o inferior a lo que desearía o esperaría? ¿Es por los datos? ¿Es por tu modelo? ¿Ambos? ¿Cómo podemos saber rápidamente si nuestro modelo no está mal afinado?

Los modelos ficticios están aquí para responder estas preguntas. Su complejidad e “inteligencia” son muy bajas: la idea es que puedas comparar tus modelos con ellos para ver cuánto mejor eres que los modelos “más estúpidos”. Tenga en cuenta que no predicen intencionalmente valores estúpidos, simplemente toman la suposición inteligente más fácil y simplista. Si su modelo ofrece peor rendimiento que el modelo ficticio, debe ajustar o cambiar su modelo por completo.

Un ejemplo simple para un regresor ficticio sería predecir siempre el valor medio del objetivo de entrenamiento, cualquiera que sea la entrada: no es ideal, pero en promedio da una suposición simplista razonable. Si su modelo real da peores resultados que este enfoque muy, muy simple, es posible que desee revisar su modelo.