Aprendizajes de un ingeniero de aprendizaje automático: Parte 3: La evaluación | de David Martín | enero de 2025

Información práctica para un enfoque basado en datos para la optimización de modelos

Foto por volard en desempaquetar

En esta tercera parte de mi serie, exploraré el proceso de evaluación, que es una pieza fundamental que conducirá a un conjunto de datos más limpio y elevará el rendimiento de su modelo. Veremos la diferencia entre la evaluación de un entrenado modelo (uno aún no en producción) y evaluación de un desplegado modelo (uno que hace predicciones del mundo real).

En Parte 1hablé del proceso de etiquetar los datos de su imagen que utiliza en su proyecto de clasificación de imágenes. Mostré cómo definir imágenes “buenas” y crear subclases. En parte 2Revisé varios conjuntos de datos, más allá de los conjuntos habituales de pruebas de validación de trenes, como conjuntos de referencia, además de cómo manejar datos sintéticos e imágenes duplicadas.

Evaluación del modelo entrenado.

Como ingenieros de aprendizaje automático, analizamos la precisión, F1, la pérdida de registros y otras métricas para decidir si un modelo está listo para pasar a producción. Todas estas son medidas importantes, pero según mi experiencia, estas puntuaciones pueden resultar engañosas, especialmente a medida que crece el número de clases.

Aunque puede llevar mucho tiempo, me parece muy importante revisar manualmente las imágenes que obtiene el modelo. equivocadoasí como el…