Un nuevo chip desarrollado por investigadores del MIT podría ayudar a pequeños vehículos aéreos no tripulados de baja potencia a evitar obstáculos mientras giran en esquinas estrechas dentro de un sistema HVAC industrial para verificar si hay fugas de gas.
El chip permite a pequeños robots autónomos y otros dispositivos con batería limitada construir mapas 3D detallados de sus entornos en tiempo real utilizando sólo tanta energía como un solo LED. Un robot podría utilizar dicho mapa para planificar un camino libre de colisiones para alcanzar su objetivo.
Normalmente, generar mapas tan completos requiere sistemas que consumen mucha energía y una gran cantidad de memoria para construir y almacenar representaciones 3D de los obstáculos en el entorno de un robot.
Los investigadores del MIT adoptaron un enfoque diferente al combinar un algoritmo de mapeo extremadamente eficiente con hardware especializado diseñado para acelerar su carga de trabajo, lo que minimiza el consumo de memoria y energía.
Este sistema en un chip consume sólo unos 6 milivatios de energía, una fracción de la energía requerida por otros sistemas.
Esta operación de bajo consumo también podría hacer que el chip sea adecuado para cascos livianos de realidad aumentada que se pueden usar durante períodos prolongados, para aplicaciones como simulación médica educativa o trabajos detallados de reparación y ensamblaje.
“Este documento muestra un ejemplo clave de cómo se puede aprovechar el diseño conjunto del algoritmo y el hardware para impulsar realmente la eficiencia energética. Si bien se ha trabajado mucho en mapas 3D compactos, lo que destaca de este trabajo es que también garantiza que el proceso para generar esos mapas sea lo más eficiente posible. Nuestro chip permite almacenar mapas muy grandes en un espacio muy pequeño y hacerlo de una manera muy eficiente desde el punto de vista energético”, afirma Vivienne Sze, profesora del Departamento de Ingeniería Eléctrica y Ciencias de la Computación (EECS), miembro de del Laboratorio de Investigación en Electrónica (RLE) y autor principal de un artículo sobre el chip.
En el artículo se unen a ella los coautores principales y estudiantes graduados del MIT Zih-Sing Fu y Peter Zhi Xuan Li, así como Sertac Karaman, profesor de aeronáutica y astronáutica y director de LIDS. El trabajo se presentó recientemente en el Simposio de circuitos integrados de muy gran escala del IEEE.
Un mapa más compacto
Para un robot, generar un mapa 3D que incluya los obstáculos de su entorno suele exigir mucha potencia porque debe almacenar las imágenes capturadas por su cámara y procesar todos los píxeles 3D de cada imagen varias veces.
En lugar de representar el entorno utilizando píxeles 3D, que son cubos llamados vóxeles, los investigadores del MIT utilizaron una técnica que mapea los obstáculos en el espacio utilizando manchas elipsoides llamadas gaussianas.
El tamaño, la forma y el grosor de estos elipsoides se pueden adaptar suavemente, de modo que coincidan con la forma de objetos curvos de manera más eficiente que si se usaran vóxeles rígidos en forma de cubo.
Es importante destacar que el mapa captura los obstáculos y el espacio libre alrededor del robot y, en conjunto, le permiten al robot planificar un camino seguro y sin colisiones. Mapear obstáculos y espacio libre con vóxeles normalmente consume mucha memoria, lo que hace que los métodos tradicionales consuman mucha energía. Debido a que los gaussianos pueden adaptarse de manera flexible a la geometría, un solo elipsoide alargado puede representar una región que ocuparía muchos vóxeles, por lo que las superficies ocupadas y el espacio libre se capturan de manera mucho más compacta.
Para su nuevo sistema en un chip, llamado Gleanmer, los investigadores emplearon un algoritmo desarrollado por su laboratorio llamado GMMap que genera eficientemente un mapa 3D del entorno del robot utilizando gaussianos para representar obstáculos.
Con los enfoques tradicionales, un robot necesitaría cargar y procesar cada imagen de profundidad varias veces para ajustar el tamaño y la forma de los elipsoides. El sistema normalmente construiría gaussianos comparando todos los píxeles de una imagen entre sí. Pero la cantidad de memoria y energía necesarias para hacer esto sigue siendo demasiado alta para muchos dispositivos periféricos.
Para resolver este problema, los investigadores del MIT inventaron una técnica que puede generar gaussianos de alta precisión a partir de imágenes de profundidad con una sola pasada, después de lo cual pueden descartar las imágenes, de modo que el chip nunca tenga que almacenar una imagen completa a la vez.
En lugar de comparar cada píxel con todos los demás píxeles de la imagen 3D, su algoritmo supone que los píxeles cercanos pertenecen al mismo gaussiano, por lo que sólo necesita comparar cada píxel con sus vecinos.
“En cualquier momento, sólo necesitamos almacenar unos pocos píxeles en la memoria, lo que reduce significativamente la huella de memoria que requiere nuestro algoritmo”, afirma Li.
Aprovechando el codiseño
Pero a medida que el robot se mueve por el espacio, normalmente ve el mismo objeto desde diferentes puntos de vista. Cuando genera gaussianos, algunos se superpondrán porque representan el mismo objeto. Esto puede hacer que el mapa 3D sea demasiado grande para almacenarlo en un dispositivo perimetral.
La fusión de gaussianos superpuestos hace que el mapa sea más compacto, pero hacerlo normalmente requiere que el algoritmo procese muchos píxeles sin procesar almacenados en la memoria. Los investigadores desarrollaron una técnica novedosa para realizar este proceso de fusión directamente en gaussianos superpuestos, sin necesidad de volver a visitar los píxeles originales. Dado que los gaussianos son más compactos que los píxeles, esto reduce significativamente los requisitos de memoria y energía.
El mismo principio se aplica a su algoritmo: la mayoría de los cálculos operan directamente en gaussianos compactos en lugar de en los píxeles originales, lo que permite la eficiencia energética.
Los investigadores explotan este principio para diseñar un chip que mantiene a los gaussianos en los que está trabajando activamente dentro de una memoria pequeña y rápida en el chip, justo al lado de las unidades computacionales. Esto sólo es posible porque el mapa gaussiano es muy compacto.
Los gaussianos en los que el robot necesita trabajar a continuación están esperando en las unidades de memoria del chip, por lo que no es necesario buscarlos desde un almacenamiento fuera del chip más distante y que consume mucha energía.
“Al tener una memoria dedicada que solo almacena los objetos que has visto en los cuadros anteriores, puedes acceder a los datos de manera mucho más eficiente”, explica Fu.
Probaron el sistema en un chip reconstruyendo una variedad de entornos 3D diversos y preexistentes. El chip también puede reconstruir obstáculos y liberar espacio directamente a partir de datos en vivo transmitidos desde la cámara de un iPhone.
Gleanmer generó mapas 3D detallados en tiempo real mientras consumía alrededor de 6 milivatios de energía. Sólo requirió alrededor del 2,5 por ciento de la energía que necesitaría el mejor chip existente para la construcción de mapas.
Al reutilizar gaussianos compactos a lo largo del camino según lo planifica, el chip permite a un robot trazar una trayectoria segura utilizando sólo alrededor del 20 por ciento de la energía que de otro modo necesitaría.
“Reducimos el consumo de memoria asegurándonos de que el algoritmo sea eficiente. Luego aceleramos la carga de trabajo que realiza ese algoritmo eficiente, de modo que al final, nuestro chip sea lo más eficiente posible”, dice Li.
Los investigadores planean mejorar aún más la eficiencia energética acercando las unidades de procesamiento del chip a los sensores que recopilan datos ambientales. También podrían explorar aplicaciones adicionales, como el uso de gaussianos para representar esquemas. Esto podría ayudar a los sistemas de inteligencia artificial a razonar sobre planos complejos de manera más eficiente.
“El mapeo 3D en tiempo real ha sido la pieza que faltaba para los pequeños sistemas autónomos. Un dron que inspecciona una tubería o un par de lentes AR que navegan por una habitación necesitan comprender el espacio que los rodea, de manera instantánea, continua y casi sin costo de energía. Gleanmer hace esto posible por primera vez en un chip que se puede sostener entre los dedos”, dice Karaman.
Este trabajo cuenta con el apoyo, en parte, de la beca MIT-MathWorks, Amazon, la Fundación Nacional de Ciencias de EE. UU. e Intel.