Cómo manejar conjuntos de datos desequilibrados en proyectos de aprendizaje automático | de Jiayan Yin

Cómo manejar conjuntos de datos desequilibrados en proyectos de aprendizaje automático | de Jiayan Yin | octubre de 2024

Técnicas para manejar conjuntos de datos desequilibrados, ejemplos y fragmentos de Python

Imagine que ha entrenado un modelo predictivo con una puntuación de precisión de hasta 0,9. Las métricas de evaluación como precisión, recuperación y puntuación f1 también parecen prometedoras. Pero tu experiencia e intuición te dijeron que algo no está bien, así que investigaste más y encontraste esto:

El aparentemente fuerte desempeño del modelo está impulsado por la clase mayoritaria. 0 en su variable objetivo. Debido a lo evidente desequilibrio entre las clases mayoritaria y minoritaria, el modelo sobresale en predecir su clase mayoritaria 0 mientras que el desempeño de la clase minoritaria 1 dista mucho de ser satisfactorio. Sin embargo, debido a que la clase 1 representa una porción muy pequeña de la variable objetivo, su desempeño tiene poco impacto en las puntuaciones generales de estas métricas de evaluación, lo que da la ilusión de que el modelo es sólido.

Este no es un caso raro. Por el contrario, los científicos de datos frecuentemente se encuentran con conjuntos de datos desequilibrados en los proyectos del mundo real. Un conjunto de datos desequilibrado se refiere a un conjunto de datos donde las clases o categorías no están…

Cómo manejar conjuntos de datos desequilibrados en proyectos de aprendizaje automático | de Jiayan Yin | octubre de 2024

ByEquipo de 7 minutos

Técnicas para manejar conjuntos de datos desequilibrados, ejemplos y fragmentos de Python

By Equipo de 7 minutos

Related Post

Conozca OmniVoice Studio: una alternativa local de código abierto a ElevenLabs

Diseñe un canal RLVR multimodal completo con Open-MM-RL, indicaciones de visión y lenguaje, puntuación de recompensas y exportación GRPO

Guía paso a paso para crear y comparar el aprendizaje federado FedAvg y FedProx en CIFAR-10 sin IID con NVIDIA FLARE

You missed

Algo hizo que el núcleo fundido de la Tierra invirtiera la dirección en 2010: ScienceAlert

Hace 24 años: Markos Moulitsas inició un blog llamado Daily Kos

Sus mitocondrias están ejecutando la red de vigilancia de su sistema inmunológico

La Primera Enmienda y la contraprotesta de los oficiales de policía fuera de servicio contra la protesta estudiantil contra ICE