Cómo mejorar el rendimiento de los modelos de detección de anomalías visuales

Introducción: Por qué se creó este artículo. Detección de anomalías: descripción general rápida. Tamaño de imagen: ¿Vale la pena un tamaño de entrada más grande? Recorte central: centrarse en el objeto. Eliminación de fondo: elimine todo lo que no necesite. Detención anticipada: utilice un conjunto de validación. Conclusión

1. Introducción

Existen varios métodos para mejorar el rendimiento, que los autores académicos utilizan para facilitar que el modelo propuesto se destaque al mostrar resultados más impresionantes en comparación con otros modelos. Por ejemplo, utilizar un tamaño de entrada mayor, que ayuda a detectar pequeños defectos; otra es eliminar parte del fondo para reducir los falsos positivos.

Un enfoque de este tipo puede resultar débil en el mundo académico porque hace que las comparaciones entre diferentes modelos sean menos justas y puede que no funcionen igual de bien en todos los conjuntos de datos. Sin embargo, estos métodos también se pueden utilizar para mejorar el rendimiento en aplicaciones prácticas si se aplican con cuidado. En este artículo, revisaremos varios de los métodos más poderosos y explicaremos cómo usarlos para lograr mejores resultados y evitar posibles desventajas.

2. Detección de anomalías

Los modelos de detección de anomalías a menudo se denominan “no supervisados”, pero este nombre puede inducir a error porque la mayoría de ellos solo requieren una clase para entrenar: imágenes normales sin defectos. para entrenar con una sola clase, los datos deben etiquetarse en clases separadas, lo que difiere de la definición habitual de sin supervisión aprendiendo.

A partir de las imágenes normales utilizadas durante el entrenamiento, el modelo aprende cómo es la “normalidad” y debería poder identificar desviaciones de ella como imágenes con defectos. Estos defectos suelen ser pequeños.
y difícil de ver, incluso para inspectores profesionales en una línea de producción. El siguiente ejemplo muestra una gota de pasta de soldadura en uno de los contactos, que es difícil de detectar sin que la máscara de tierra muestre la ubicación del defecto a la derecha.

Para obtener más detalles sobre la detección visual de anomalías industriales, consulte esta publicación o esta encuesta.

Imagen tomada del conjunto de datos VisA (CC-BY-4.0) y procesada con la biblioteca Anomalib

3. Tamaño de la imagen

Si las imágenes de su conjunto de datos tienen pequeños defectos (menos del 0,2% de la imagen aproximadamente, este número es arbitrario y depende del modelo utilizado y otros factores) que el modelo no puede detectar, intente aumentar el tamaño de entrada. A menudo ayuda a detectar tales defectos haciéndolos lo suficientemente grandes para que el modelo los vea.

Cuando hay defectos grandes (10% de la imagen o más, este número también es arbitrario), debes tener más cuidado con la selección del modelo. Algunos modelos, como PatchCore, muestran mejores resultados para diferentes tamaños de defectos con un tamaño de entrada mayor, otros, como RD4AD, pueden degradarse significativamente para defectos más grandes, como se describe en nuestro documento de referencia, Tab. 5 y 14. La mejor práctica es probar cómo funciona el modelo seleccionado en diferentes tipos de defectos que tenga.

Otra consideración importante al utilizar un tamaño de entrada mayor es la velocidad de inferencia y las limitaciones de memoria. Como se muestra en
En el documento MVTec AD 2, Fig.6, el tiempo de inferencia y el uso de memoria aumentaron significativamente para casi todos los modelos probados con tamaños de entrada más grandes.

4. Cultivo central

Si tiene datos con un objeto en el centro de una imagen y el resto se puede recortar de forma segura, hágalo. Como se muestra en la imagen siguiente, recortar más cerca de la pieza inspeccionada ayuda a evitar falsos positivos. Un efecto secundario importante es que el tamaño relativo de la pieza inspeccionada también aumenta; Como se describió anteriormente, esto podría ayudarlo a obtener mejores resultados para defectos pequeños o aumentar la velocidad de inferencia al permitirle reducir el tamaño de la imagen.

Imagen tomada del conjunto de datos VisA (CC-BY-4.0) y editada por el autor
Posible falso positivo encerrado en un círculo rojo

Advertencia: Los conjuntos de datos más populares presentan un caso en el que el objeto principal se puede recortar de forma segura en el centro, como se muestra en la Fig. 2 aquí, o en la imagen de arriba. Por esta razón, muchas implementaciones originales de métodos de última generación incluyen el aumento del cultivo central. Usar un recorte central puede resultar problemático en aplicaciones del mundo real con defectos cerca de los bordes de la imagen; en ese caso, asegúrese de que dicho recorte esté desactivado.

5. Eliminación de fondo

Elimine el fondo para tener aún menos falsos positivos. De manera similar a aplicar un recorte central, asegúrese de que las anomalías o defectos en el área eliminada no afecten la calidad de la pieza producida. Si nunca ha tenido defectos en alguna parte del objeto en el pasado, no lo elimine, porque pueden surgir defectos allí en el futuro y no querrá perdérselos.

Imagen tomada del conjunto de datos VisA (CC-BY-4.0) y editada por el autor
Posible falso positivo encerrado en un círculo rojo

6. Parada anticipada

La mayoría de los modelos de detección de anomalías utilizan un recuento de época fijo, que a menudo está optimizado para conjuntos de datos populares. Podría resultar beneficioso intentar detener sus datos anticipadamente para evitar un sobreajuste o entrenar más rápido con menos épocas. A veces se hace un mal uso de la parada temprana al utilizar el rendimiento del conjunto de pruebas para detener el entrenamiento, lo que hace que los resultados reportados sean irrealmente buenos. Sin embargo, si lo aplica a un conjunto de validación separado, aún puede lograr una mejora sustancial, como se muestra en la Tab. 9 aquí.

Advertencia: algunas implementaciones originales de modelos de última generación pueden utilizar la detención anticipada en el conjunto de prueba o informar los mejores resultados en todas las épocas según el rendimiento del conjunto de prueba. Mire el código antes de ejecutarlo para asegurarse de que no tendrá un modelo que sobreajuste el conjunto de prueba con resultados demasiado optimistas.

7. Conclusión

Aumentar el tamaño de la imagen HACER: comprobar si el modelo seleccionado es capaz de detectar diferentes tamaños de defectos; asegúrese de que la velocidad de inferencia sea suficiente NO: omita defectos grandes Recorte central SÍ: asegúrese de que el objeto inspeccionado esté completamente en la imagen después del recorte NO: omita defectos en el área eliminada Quite el fondo SÍ: asegúrese de que el área que está eliminando sea irrelevante para la inspección NO: omita defectos en el fondo Detención anticipada SÍ: utilice el conjunto de validación NO: sobreadapte el conjunto de prueba

Asegúrese de que la aplicación de estos métodos o su combinación no cause defectos perdidos. Algunos de ellos pueden resultar contraproducentes incluso si se aplican a un conjunto de datos diferente disponible públicamente. En un escenario del mundo real, esto podría resultar en la entrega de piezas defectuosas a un cliente.

Sin embargo, si se usan con cuidado, pueden mejorar notablemente el rendimiento de los modelos de detección de anomalías en aplicaciones prácticas al aprovechar el conocimiento de sus datos y defectos.

Siga al autor en LinkedIn para obtener más información sobre la detección de anomalías visuales industriales.

Referencias

A. Baitieva, Y. Bouaouni, A. Briot, D. Ameln, S. Khalfaoui y S. Akcay. Más allá de los puntos de referencia académicos: análisis crítico y mejores prácticas para la detección visual de anomalías industriales (2025), Taller CVPR sobre detección de anomalías visuales y novedades (VAND) Y. Zou, J. Jeong, L. Pemula, D. Zhang y O. Dabeer, Capacitación previa autosupervisada SPot-the-Difference para la detección y segmentación de anomalías (2022), ECCV S. Akcay, D. Ameln, A. Vaidya, B. Lakshmanan, N. Ahuja y U. Genc, Anomalib (2022), ICIP J. Liu, G. Xie, J. Wang, S. Li, C. Wang, F. Zheng y Y. Jin, Detección de anomalías de imágenes industriales profundas: una encuesta (2024), Machine Intelligence Research L. Heckler-Kram, J. Neudeck, U. Scheler, R. König y C. Steger, El conjunto de datos MVTec AD 2: Escenarios avanzados para la detección de anomalías no supervisadas (2025), preimpresión de arXiv K. Roth, L. Pemula, J. Zepeda, B. Schölkopf, T. Brox, P. Gehler, Hacia el retiro total en la detección de anomalías industriales (2022), CVPR