Conoce a Deepfleet: la nueva suite de modelos AI de Amazon que puede predecir los patrones de tráfico futuros para las flotas de robots móviles

Amazon ha alcanzado un hito notable al desplegar su robot de un millón en los centros globales de cumplimiento y clasificación, solidificando su posición como el operador más grande del mundo de robótica industrial. Este logro coincide con el lanzamiento de Profundoun conjunto innovador de modelos de base diseñados para mejorar la coordinación entre vastas flotas de robots móviles. Entrenados en miles de millones de horas de datos operativos del mundo real, estos modelos prometen optimizar los movimientos de los robots, reducir la congestión y aumentar la eficiencia general hasta en un 10%.

El ascenso de los modelos de base en robótica

Los modelos de base, popularizados en Language and Vision AI, dependen de conjuntos de datos masivos para aprender patrones generales que pueden adaptarse a varias tareas. Amazon está aplicando este enfoque de la robótica, donde la coordinación de miles de robots en entornos de almacén dinámicos exige inteligencia predictiva más allá de las simulaciones tradicionales.

En los centros de realización, los robots transportan estantes de inventario a trabajadores humanos, mientras que en las instalaciones de clasificación, manejan paquetes para la entrega. Con las flotas que numeran en los cientos de miles, los desafíos como los atascos y los puntos muertos pueden ralentizar las operaciones. Deepfleet aborda estos pronosticando trayectorias e interacciones de robots, lo que permite la planificación proactiva.

Los modelos se basan en diversos datos en diseños de almacén, generaciones de robots y ciclos operativos, capturando comportamientos emergentes como las ondas de congestión. Esta riqueza de datos, que abarca millones de horas de robot, permite que Deepfleet generalice en todos los escenarios, al igual que cómo los modelos de idiomas grandes se adaptan a las nuevas consultas.

Explorando las arquitecturas Deepfleet

Deepfleet comprende cuatro arquitecturas/modelos distintos, cada uno con sesgos inductivos únicos para modelar la dinámica multi-robot:

  • Modelo centrado en el robot (RC): Este transformador autorregresivo se centra en los robots individuales, utilizando datos locales del vecindario (por ejemplo, robots, objetos y marcadores cercanos) para predecir las siguientes acciones. Procesa actualizaciones y pares asincrónicos con un simulador de entorno determinista para la evolución del estado. Con 97 millones de parámetros, se destacó en las evaluaciones, logrando los errores más bajos en la posición y las predicciones estatales.
https://www.amazon.science/blog/amazon-builds-first-foundation-model-for-multirobot-coordination?utm_campaign=amazon-builds-first-foundation-model-for-multirobot-coordination&ut m_medium = Amazon-Fullment-Technologies-Robotics & utm_source = LinkedIn & utm_content = 2025-08-11-amazon-builds-first-fundation-model-for-multirobot-coordination & utm_term = 2025-august
  • Modelo de piso de robot (RF): Empleando la atención cruzada, este modelo integra estados de robot con características de piso global como vértices y bordes. Decodifica las acciones sincrónicamente, equilibrando las interacciones locales y el contexto de todo el almacén. Con 840 millones de parámetros, se desempeñó fuertemente en las predicciones de tiempo.
https://www.amazon.science/blog/amazon-builds-first-foundation-model-for-multirobot-coordination?utm_campaign=amazon-builds-first-foundation-model-for-multirobot-coordination&ut m_medium = Amazon-Fullment-Technologies-Robotics & utm_source = LinkedIn & utm_content = 2025-08-11-amazon-builds-first-fundation-model-for-multirobot-coordination & utm_term = 2025-august
  • Modelo de piso de imagen (IF): Tratando el almacén como una imagen multicanal, esto utiliza codificación convolucional para características espaciales y transformadores para secuencias temporales. Sin embargo, tuvo un rendimiento inferior, probablemente debido a los desafíos para capturar las interacciones de robot a nivel de píxel a escala.
  • Modelo de piso gráfico (GF): Combinando redes neuronales gráficas con transformadores, esto representa el piso como un gráfico espacio -temporal. Maneja las relaciones globales de manera eficiente, prediciendo acciones y estados con solo 13 millones de parámetros, lo que lo hace computacionalmente delgado pero competitivo.
https://www.amazon.science/blog/amazon-builds-first-foundation-model-for-multirobot-coordination?utm_campaign=amazon-builds-first-foundation-model-for-multirobot-coordination&ut m_medium = Amazon-Fullment-Technologies-Robotics & utm_source = LinkedIn & utm_content = 2025-08-11-amazon-builds-first-fundation-model-for-multirobot-coordination & utm_term = 2025-august

Estos diseños varían en enfoques temporales (sincrónicos versus basados en eventos) y espaciales (locales versus globales), lo que permite a Amazon probar lo que mejor se adapta a los pronósticos a gran escala.

Información de rendimiento y potencial de escala

Las evaluaciones sobre los datos de almacenamiento mantenidos utilizaron métricas como la deformación de tiempo dinámico (DTW) para la precisión trayectoria y el error de retraso de congestión (CDE) para el realismo operativo. El modelo RC lideró en general, con puntajes DTW de 8.68 para la posición y 0.11% de CDE, mientras que GF ofreció fuertes resultados a una complejidad más baja.

Los experimentos de escala confirmaron que los modelos y conjuntos de datos más grandes reducen las pérdidas de predicción, siguiendo patrones vistos en otros modelos de base. Para GF, las extrapolaciones sugieren que una versión de 1 mil millones de parámetros capacitados en 6.6 millones de episodios podría optimizar el cálculo de manera efectiva.

Esta escalabilidad es clave, ya que la vasta flota de robots de Amazon proporciona una ventaja de datos inigualable. Las primeras aplicaciones incluyen el pronóstico de congestión y el enrutamiento adaptativo, con potencial para la asignación de tareas y la prevención de punto muerto.

Impacto del mundo real en las operaciones

Deepfleet ya está mejorando la red de Amazon, que abarca más de 300 instalaciones en todo el mundo, incluida una implementación reciente en Japón. Al mejorar la eficiencia de viaje de los robots, permite un procesamiento de paquetes más rápido y menores costos, beneficiando directamente a los clientes.

Más allá de la eficiencia, Amazon enfatiza el desarrollo de la fuerza laboral, habiendo subido sobre 700,000 empleados desde 2019 en robótica y roles relacionados con la IA. Esta integración crea trabajos más seguros al descargar tareas pesadas a las máquinas.

Mirando hacia el futuro

A medida que Amazon continúa refinando Deepfleet, enfocando las variantes de RC, RF y GF, la tecnología podría redefinir sistemas múltiples de robots en logística. Al aprovechar la IA para anticipar los comportamientos de la flota, va más allá del control reactivo, allanando el camino para operaciones más autónomas y escalables. Esta innovación subraya cómo se extienden los modelos de base desde los reinos digitales hasta la automatización física, lo que potencialmente transforman las industrias que dependen de la robótica coordinada.


Mira el Papel y Blog técnico. No dude en ver nuestro Página de Github para tutoriales, códigos y cuadernos. Además, siéntete libre de seguirnos Gorjeo Y no olvides unirte a nuestro Subreddit de 100k+ ml y suscribirse a Nuestro boletín.


Asif Razzaq es el CEO de MarktechPost Media Inc .. Como empresario e ingeniero visionario, ASIF se compromete a aprovechar el potencial de la inteligencia artificial para el bien social. Su esfuerzo más reciente es el lanzamiento de una plataforma de medios de inteligencia artificial, MarktechPost, que se destaca por su cobertura profunda de noticias de aprendizaje automático y de aprendizaje profundo que es técnicamente sólido y fácilmente comprensible por una audiencia amplia. La plataforma cuenta con más de 2 millones de vistas mensuales, ilustrando su popularidad entre el público.