Los modelos ficticios de Scikit-learn. Ten siempre un chupete a tu lado. | de Yoann Mocquin

Los modelos ficticios de Scikit-learn. Ten siempre un chupete a tu lado. | de Yoann Mocquin | febrero de 2024

Si te gusta o quieres aprender aprendizaje automático con scikit-learn, consulta mi serie de tutoriales sobre este increíble paquete:

Tutorial de Sklearn

Todas las imágenes por autor.

Los modelos ficticios son modelos muy simplistas que deben usarse como base para comparar los modelos reales. Una línea de base es sólo una especie de punto de referencia con el que compararse. Cuando calcula sus primeros resultados de validación cruzada para estimar el rendimiento de su modelo, normalmente sabe que cuanto mayor sea la puntuación, mejor, y si la puntuación es bastante alta en el primer intento, es fantástico. Pero no suele ser así.

¿Qué hacer si la primera puntuación de precisión es bastante baja, o inferior a lo que desearía o esperaría? ¿Es por los datos? ¿Es por tu modelo? ¿Ambos? ¿Cómo podemos saber rápidamente si nuestro modelo no está mal afinado?

Los modelos ficticios están aquí para responder estas preguntas. Su complejidad e “inteligencia” son muy bajas: la idea es que puedas comparar tus modelos con ellos para ver cuánto mejor eres que los modelos “más estúpidos”. Tenga en cuenta que no predicen intencionalmente valores estúpidos, simplemente toman la suposición inteligente más fácil y simplista. Si su modelo ofrece peor rendimiento que el modelo ficticio, debe ajustar o cambiar su modelo por completo.

Un ejemplo simple para un regresor ficticio sería predecir siempre el valor medio del objetivo de entrenamiento, cualquiera que sea la entrada: no es ideal, pero en promedio da una suposición simplista razonable. Si su modelo real da peores resultados que este enfoque muy, muy simple, es posible que desee revisar su modelo.

Los modelos ficticios de Scikit-learn. Ten siempre un chupete a tu lado. | de Yoann Mocquin | febrero de 2024

ByEquipo de 7 minutos

Tutorial de Sklearn

By Equipo de 7 minutos

Related Post

xAI lanza grok-voice-think-fast-1.0: encabezando el banco de τ-voice con un 67,3%, superando a Gemini, GPT Realtime y más

Una implementación de codificación en OpenMementos de Microsoft con análisis de estructura de seguimiento, compresión de contexto y preparación de datos de ajuste fino

Conozca GitNexus: un motor de gráficos de conocimiento nativo de MCP de código abierto que brinda al código Claude y al cursor un conocimiento estructural completo de la base de código

You missed

Durante más de 100.000 años, un depósito de magma oculto creció debajo del volcán Methana “extinto” de Grecia

Trump sale ileso tras incidente de seguridad en cena de corresponsales de la Casa Blanca

Se reinicia el enlace ferroviario de alta velocidad entre Madrid y Málaga

Sanjay Dutt dice que la idea de la secuela de Khal Nayak surgió durante la pena de cárcel