Comprensión de la intersección sobre la unión para la detección de objetos (código) |  de Kiprono Elijah Koech |  octubre de 2023

La evaluación de los modelos de detección de objetos se reduce a una cosa: determinar si una detección es válida o no.

Determinar si la detección es válida requiere comprender el Intersección sobre la métrica de la Unión (IoU).

Este artículo cubre lo siguiente:

  • Conceptos básicos de IoU ¿Qué es el pagaré??
  • Cómo calcular (teóricamente y en código Python) IoU para un solo par de cuadros delimitadores de detección y verdad fundamental
  • Calcular IoU para múltiples conjuntos de cuadros delimitadores de verdad predicha y del terreno.
  • Cómo para interpretar el valor IoU?

IoU es una métrica central para la evaluación de modelos de detección de objetos. Mide la precisión del detector de objetos evaluando el grado de superposición entre el cuadro de detección y el cuadro de verdad del terreno.

  • A caja de verdad terrestre o etiqueta es un cuadro anotado que muestra dónde está el objeto (la anotación a menudo se hace a mano y el cuadro de verdad fundamental se considera la posición real del objeto).
  • El cuadro de detección o cuadro delimitador previsto es la predicción del detector de objetos.

Formalmente, pagaré es el área de intersección entre la verdad fundamental (gt) y cuadro previsto (PD) dividido por la unión de las dos cajas.

Definición de IoU (Imagen del autor).

Comencemos con un ejemplo sencillo. Computación de IoU para una detección y una verdad fundamental.

Para hacer eso, necesitaremos las coordenadas superior izquierda (x1, y1) e inferior derecha (x2, y2) de los dos cuadros.

En la siguiente figura (derecha), tenemos dos cuadros delimitadores:

Cuadro delimitador previsto (p-box): (px1, py1, px2, py2) = (859, 31, 1002, 176)
Cuadro delimitador de verdad fundamental (cuadro t): (tx1, ty1, tx2, ty2) = (860, 68, 976, 184)