Cientos de robots van y vienen por el suelo de un colosal almacén robótico, agarrando artículos y entregándolos a trabajadores humanos para su embalaje y envío. Estos almacenes se están convirtiendo cada vez más en parte de la cadena de suministro en muchas industrias, desde el comercio electrónico hasta la producción de automóviles.
Sin embargo, llevar y traer 800 robots a sus destinos de manera eficiente y al mismo tiempo evitar que choquen entre sí no es una tarea fácil. Es un problema tan complejo que incluso los mejores algoritmos de búsqueda de caminos luchan por mantenerse al día con el ritmo vertiginoso del comercio electrónico o la fabricación.
En cierto sentido, estos robots son como automóviles que intentan navegar por el centro de una ciudad abarrotada. Entonces, un grupo de investigadores del MIT que utilizan la IA para mitigar la congestión del tráfico aplicaron ideas de ese dominio para abordar este problema.
Construyeron un modelo de aprendizaje profundo que codifica información importante sobre el almacén, incluidos los robots, las rutas planificadas, las tareas y los obstáculos, y la utiliza para predecir las mejores áreas del almacén para descongestionar y mejorar la eficiencia general.
Su técnica divide los robots del almacén en grupos, de modo que estos grupos más pequeños de robots puedan descongestionarse más rápido con los algoritmos tradicionales utilizados para coordinar los robots. Al final, su método descongestiona los robots casi cuatro veces más rápido que un fuerte método de búsqueda aleatoria.
Además de agilizar las operaciones de almacén, este enfoque de aprendizaje profundo podría utilizarse en otras tareas de planificación complejas, como el diseño de chips de computadora o el trazado de tuberías en edificios grandes.
“Ideamos una nueva arquitectura de red neuronal que es realmente adecuada para operaciones en tiempo real a la escala y complejidad de estos almacenes. Puede codificar cientos de robots en términos de sus trayectorias, orígenes, destinos y relaciones con otros robots, y puede hacerlo de una manera eficiente que reutiliza el cálculo entre grupos de robots”, dice Cathy Wu, especialista en carreras de Gilbert W. Winslow. Profesor Asistente de Desarrollo en Ingeniería Civil y Ambiental (CEE), y miembro del Laboratorio de Sistemas de Información y Decisión (LIDS) y del Instituto de Datos, Sistemas y Sociedad (IDSS).
Wu, autor principal de un artículo sobre esta técnica, está acompañado por el autor principal Zhongxia Yan, estudiante de posgrado en ingeniería eléctrica e informática. El trabajo será presentado en la Conferencia Internacional sobre Representaciones del Aprendizaje.
Tetris robótico
A vista de pájaro, el suelo de un almacén robótico de comercio electrónico se parece un poco a un trepidante juego de “Tetris”.
Cuando llega el pedido de un cliente, un robot viaja a un área del almacén, toma el estante que contiene el artículo solicitado y lo entrega a un operador humano que recoge y empaqueta el artículo. Cientos de robots hacen esto simultáneamente, y si las trayectorias de dos robots entran en conflicto al cruzar el enorme almacén, podrían estrellarse.
Los algoritmos tradicionales basados en búsqueda evitan posibles fallos al mantener a un robot en su curso y replanificar la trayectoria del otro. Pero con tantos robots y posibles colisiones, el problema crece rápidamente de manera exponencial.
“Como el almacén funciona online, los robots se replanifican aproximadamente cada 100 milisegundos. Eso significa que cada segundo, un robot se replanifica 10 veces. Por lo tanto, estas operaciones deben ser muy rápidas”, afirma Wu.
Debido a que el tiempo es tan crítico durante la replanificación, los investigadores del MIT utilizan el aprendizaje automático para centrar la replanificación en las áreas de congestión más procesables, donde existe el mayor potencial para reducir el tiempo total de viaje de los robots.
Wu y Yan construyeron una arquitectura de red neuronal que considera grupos más pequeños de robots al mismo tiempo. Por ejemplo, en un almacén con 800 robots, la red podría dividir el piso del almacén en grupos más pequeños que contengan 40 robots cada uno.
Luego, predice qué grupo tiene el mayor potencial para mejorar la solución general si se utilizara un solucionador basado en búsquedas para coordinar las trayectorias de los robots en ese grupo.
En un proceso iterativo, el algoritmo general elige el grupo de robots más prometedor con la red neuronal, descongestiona el grupo con el solucionador basado en búsquedas, luego elige el siguiente grupo más prometedor con la red neuronal, y así sucesivamente.
Considerando las relaciones
La red neuronal puede razonar sobre grupos de robots de manera eficiente porque captura relaciones complicadas que existen entre robots individuales. Por ejemplo, aunque un robot pueda estar muy lejos de otro inicialmente, sus caminos aún podrían cruzarse durante sus viajes.
La técnica también agiliza el cálculo codificando las restricciones sólo una vez, en lugar de repetir el proceso para cada subproblema. Por ejemplo, en un almacén con 800 robots, descongestionar un grupo de 40 robots requiere mantener los otros 760 robots como restricciones. Otros enfoques requieren razonar sobre los 800 robots una vez por grupo en cada iteración.
En cambio, el enfoque de los investigadores sólo requiere razonar sobre los 800 robots una vez en todos los grupos en cada iteración.
“El almacén es un gran escenario, por lo que muchos de estos grupos de robots tendrán algunos aspectos compartidos del problema mayor. Diseñamos nuestra arquitectura para hacer uso de esta información común”, añade.
Probaron su técnica en varios entornos simulados, incluidos algunos configurados como almacenes, otros con obstáculos aleatorios e incluso escenarios tipo laberinto que emulan los interiores de los edificios.
Al identificar grupos más eficaces para descongestionar, su enfoque basado en el aprendizaje descongestiona el almacén hasta cuatro veces más rápido que los enfoques sólidos que no se basan en el aprendizaje. Incluso cuando tuvieron en cuenta la sobrecarga computacional adicional de ejecutar la red neuronal, su enfoque resolvió el problema 3,5 veces más rápido.
En el futuro, los investigadores quieren obtener información sencilla y basada en reglas a partir de su modelo neuronal, ya que las decisiones de la red neuronal pueden ser opacas y difíciles de interpretar. Los métodos más simples y basados en reglas también podrían ser más fáciles de implementar y mantener en entornos de almacén robóticos reales.
“Este enfoque se basa en una arquitectura novedosa donde los mecanismos de convolución y atención interactúan de manera efectiva y eficiente. Sorprendentemente, esto permite tener en cuenta el componente espaciotemporal de los caminos construidos sin la necesidad de ingeniería de características específicas del problema. Los resultados son sorprendentes: no sólo es posible mejorar los métodos de búsqueda de barrios más modernos en términos de calidad de la solución y velocidad, sino que el modelo se generaliza maravillosamente a casos no vistos”, afirma Andrea Lodi, Andrew H. y Ann R. Tisch, profesores de Cornell Tech, y que no participaron en esta investigación.
Este trabajo fue apoyado por Amazon y el MIT Amazon Science Hub.