Información práctica para un enfoque basado en datos para la optimización de modelos

Foto por Josué Sortino en desempaquetar

Se dice que para que un modelo de aprendizaje automático tenga éxito, es necesario tener buenos datos. Si bien esto es cierto (y bastante obvio), es extremadamente difícil definir, construir y mantener buenos datos. Permítanme compartir con ustedes los procesos únicos que he aprendido durante varios años construyendo un sistema de clasificación de imágenes en constante crecimiento y cómo puede aplicar estas técnicas a su propia aplicación.

Con perseverancia y diligencia, puede evitar el clásico “entra basura, sale basura”, maximizar la precisión de su modelo y demostrar un valor comercial real.

En esta serie de artículos, profundizaré en el cuidado y la alimentación de una aplicación de clasificación de imágenes de una sola etiqueta y varias clases y en lo que se necesita para alcanzar el más alto nivel de rendimiento. No entraré en codificación ni en interfaces de usuario específicas, solo en los conceptos principales que puedes incorporar para satisfacer tus necesidades con las herramientas a tu disposición.

A continuación se ofrece una breve descripción de los artículos. Notarás que el modelo es el último en la lista, ya que, ante todo, debemos centrarnos en seleccionar los datos:

  • Parte 1: Los datos: estándares, clases y subclases de etiquetado

Por automata