El equipo de inteligencia física presenta MEM para robots: un sistema de memoria multiescala que brinda a los VLA de Gemma 3-4B un contexto de 15 minutos para tareas complejas
Las políticas robóticas de extremo a extremo actuales, específicamente los modelos Visión-Lenguaje-Acción (VLA), generalmente operan con una sola observación o una historia muy corta. Esta “falta de memoria” hace que…