Rutas de personas de Amazon Rekognition es una capacidad basada en el aprendizaje automático (ML) de Vídeo de reconocimiento de Amazon que los usuarios pueden utilizar para comprender dónde, cuándo y cómo se mueve cada persona en un vídeo. Esta capacidad se puede utilizar para múltiples casos de uso, como por ejemplo para comprender:
- Análisis minorista – Flujo de clientes en la tienda e identificación de áreas de alto tráfico.
- Analítica deportiva – Movimientos de los jugadores a través del campo o cancha.
- seguridad industrial – Movimiento de trabajadores en los entornos laborales para promover el cumplimiento de los protocolos de seguridad.
Después de una cuidadosa consideración, tomamos la decisión de suspender la ruta de personas de Rekognition el 31 de octubre de 2025. Los nuevos clientes no podrán acceder a la capacidad a partir del 24 de octubre de 2024, pero los clientes existentes podrán utilizar la capacidad normalmente hasta el 31 de octubre. , 2025.
Esta publicación analiza una solución alternativa para la ruta de personas de Rekognition y cómo puede implementar esta solución en sus aplicaciones.
Alternativas a Rekognition people pathing
Una alternativa a la ruta de personas de Amazon Rekognition combina el modelo de aprendizaje automático de código abierto YOLOv9que se utiliza para la detección de objetos, y el algoritmo ByteTrack de código abierto, que se utiliza para el seguimiento de múltiples objetos.
Descripción general de YOLO9 y ByteTrack
YOLOv9 es el último de la serie de modelos de detección de objetos YOLO. Utiliza una arquitectura especializada llamada Red de agregación de capas eficiente generalizada (GELAN) para analizar imágenes de manera eficiente. El modelo divide una imagen en una cuadrícula, identificando y ubicando rápidamente objetos en cada sección en una sola pasada. Luego refina sus resultados utilizando una técnica llamada información de gradiente programable (PGI) para mejorar la precisión, especialmente para objetos que se pasan por alto fácilmente. Esta combinación de velocidad y precisión hace que YOLOv9 sea ideal para aplicaciones que necesitan una detección de objetos rápida y confiable.
pista de bytes es un algoritmo para rastrear múltiples objetos en movimiento en videos, como personas caminando por una tienda. Lo que lo hace especial es cómo maneja objetos que son a la vez sencillos y difíciles de detectar. Incluso cuando alguien está parcialmente escondido o entre una multitud, ByteTrack a menudo aún puede seguirlo. Está diseñado para ser rápido y preciso, y funciona bien incluso cuando hay muchas personas a las que rastrear simultáneamente.
Cuando combinas YOLOv9 y ByteTrack para la ruta de personas, puedes revisar los movimientos de las personas en los cuadros de video. YOLOv9 proporciona detecciones de personas en cada cuadro de video. ByteTrack toma estas detecciones y las asocia entre fotogramas, creando pistas consistentes para cada individuo, mostrando cómo las personas se mueven a través del video a lo largo del tiempo.
Código de ejemplo
El siguiente ejemplo de código es un script de Python que se puede utilizar como AWS Lambda función o como parte de su proceso de procesamiento. También puede implementar YOLOv9 y ByteTrack para inferencia usando Amazon SageMaker. SageMaker ofrece varias opciones para la implementación de modelos, como inferencia en tiempo real, inferencia asincrónica, inferencia sin servidor e inferencia por lotes. Puede elegir la opción adecuada según los requisitos de su negocio.
Aquí hay un desglose de alto nivel de cómo se ejecuta el script de Python:
- Cargar el modelo YOLOv9 – Este modelo se utiliza para detectar objetos en cada cuadro.
- Inicie el rastreador ByteTrack – Este rastreador asigna identificaciones únicas a los objetos y los rastrea a través de fotogramas.
- Iterar el vídeo fotograma a fotograma – Para cada fotograma, el script itera detectando objetos, siguiendo la ruta y dibujando cuadros delimitadores y etiquetas alrededor de ellos. Todo esto se guarda en un archivo JSON.
- Salida del video procesado – El vídeo final se guarda con todos los objetos detectados y rastreados, anotados en cada fotograma.
Validación
Usamos el siguiente video para mostrar esta integración. El video muestra una sesión de práctica de fútbol, donde el quarterback está iniciando una jugada.
La siguiente tabla muestra un ejemplo del contenido del archivo JSON con resultados de seguimiento de personas por marca de tiempo.
| Marca de tiempo | ÍndicePersona | cuadro delimitador… | |||
| Altura | Izquierda | Arriba | Ancho | ||
| 0 | 42 | 0.51017 | 0.67687 | 0.44032 | 0.17873 |
| 0 | 63 | 0.41175 | 0.05670 | 0.3148 | 0.07048 |
| 1 | 42 | 0.49158 | 0.69260 | 0.44224 | 0.16388 |
| 1 | 65 | 0,35100 | 0.06183 | 0.57447 | 0.06801 |
| 4 | 42 | 0.49799 | 0.70451 | 0.428963 | 0.13996 |
| 4 | 63 | 0.33107 | 0.05155 | 0,59550 | 0.09304 |
| 4 | 65 | 0.78138 | 0.49435 | 0.20948 | 0.24886 |
| 7 | 42 | 0.42591 | 0.65892 | 0.44306 | 0.0951 |
| 7 | 63 | 0.28395 | 0.06604 | 0.58020 | 0.13908 |
| 7 | 65 | 0.68804 | 0.43296 | 0.30451 | 0.18394 |
El siguiente vídeo muestra los resultados con las personas que siguen la producción.
Otras soluciones de código abierto para rutas de personas
Aunque YOLOv9 y ByteTrack ofrecen una combinación poderosa para la ruta de personas, vale la pena considerar otras alternativas de código abierto:
- Ordenación profunda – Un algoritmo popular que combina funciones de aprendizaje profundo con métodos de seguimiento tradicionales.
- FeriaMOT – Integra la detección y reidentificación de objetos en una única red, ofreciendo a los usuarios la capacidad de rastrear objetos en escenas concurridas
Estas soluciones se pueden implementar de manera efectiva utilizando Amazon SageMaker para realizar inferencias.
Conclusión
En esta publicación, describimos cómo puede probar e implementar YOLOv9 y Byte Track como una alternativa a la ruta de personas de Rekognition. En combinación con las ofertas de herramientas de AWS, como AWS Lambda y Amazon SageMaker, puede implementar dichas herramientas de código abierto para sus aplicaciones.
Acerca de los autores
Fangzhou Cheng es científico aplicado sénior en AWS. Crea soluciones científicas para AWS Rekgnition y AWS Monitron para ofrecer a los clientes modelos de última generación. Sus áreas de enfoque incluyen IA generativa, visión por computadora y análisis de datos de series temporales.
Marcel Pividal es una SA Senior de Servicios de IA en la Organización Mundial de Especialistas, que aporta más de 22 años de experiencia en la transformación de desafíos comerciales complejos en soluciones tecnológicas innovadoras. Como líder intelectual en la implementación de IA generativa, se especializa en el desarrollo de arquitecturas de IA seguras y compatibles para implementaciones a escala empresarial en múltiples industrias.