Genesis AI lanza la plataforma de física Nyx, Quadrants y Genesis World 1.0 para la evaluación de modelos escalables de Robotics Foundation

Genesis AI lanzó Genesis World 1.0. La plataforma consta de cuatro componentes: el motor de física Genesis World, Nyx (un renderizador de seguimiento de ruta en tiempo real), Quadrants (un compilador de Python a GPU) y una interfaz de simulación. Está diseñado para acelerar el desarrollo de modelos básicos de robótica mediante una evaluación basada en simulación.

El desarrollo de modelos robóticos tiene dos cuellos de botella: los datos y la velocidad de iteración. El campo se ha centrado en gran medida en los datos. Genesis AI sostiene que el cuello de botella más lento y menos discutido es el propio ciclo de desarrollo del modelo, específicamente, la rapidez con la que los equipos pueden evaluar las políticas candidatas y comparar los puntos de control de los modelos.

¿Qué problema resuelve esto?

Una evaluación de políticas típica en Génesis abarca cientos de tareas con cientos de episodios cada una. Ejecutar esto en el mundo real requiere más de 200 horas de operación continua del robot con un operador y una estación de robot, para una sola pasada de evaluación. Las comparaciones estadísticamente significativas entre puntos de control requieren muchos pases de este tipo.

Genesis World 1.0 ejecuta la misma evaluación en menos de 0,5 horas, sin humanos ni hardware en el ciclo y con una consistencia de resultados exacta entre ejecuciones. Esto es aproximadamente dos órdenes de magnitud más rápido que la evaluación en el mundo real.

El equipo de investigación eligió deliberadamente priorizar la evaluación antes de utilizar la simulación para la generación de datos de entrenamiento. Su razonamiento: si el entrenamiento y la evaluación comparten la misma distribución simulada, una mejora en el desempeño podría reflejar un ajuste más estricto a la dinámica del simulador en lugar de un modelo genuinamente mejor. Mantener las dos tuberías separadas produce una señal más limpia.

El equipo de investigación describe este enfoque de evaluación como real-to-sim de tiro cero: las políticas evaluadas en simulación se entrenan exclusivamente con datos del mundo real. Ningún dato simulado ingresa al preentrenamiento.

Resultados de correlación Sim-real

El equipo de investigación de Génesis informa una correlación de Pearson de 0,8996 (IC del 95 %: [0.7439, 0.9314]) entre la simulación y las implementaciones en hardware. La evaluación cubrió tres variantes de modelo (pequeño, mediano y grande) en 14 tareas con 200 episodios por tarea. El equipo de investigación realizó 1.000.000 de iteraciones de arranque para estimar los intervalos de confianza.

La infracción de rango máximo medio (MMRV), una métrica propuesta en SimplerEnv, fue de 0,0166 (IC del 95 %: [0.0102, 0.0474]). Un MMRV bajo significa que el simulador conserva la clasificación de rendimiento relativo de diferentes modelos.

Para diagnosticar de dónde proviene la divergencia de simulación a real, el equipo de Genesis construyó una plataforma en tiempo real. Ejecuta el simulador y el robot físico en paralelo desde la misma inicialización. Las observaciones (encuadres de cámara y propiocepción) pueden provenir del simulador, del robot o de una combinación de ambos. Intercambiar una fuente a la vez aísla si la divergencia se origina en la física, la representación, la comunicación o el control.

Después de este trabajo, su brecha de realidad es un 45% menor, medida por la puntuación FID en su conjunto de datos, que el siguiente mejor simulador alternativo.

https://www.genesis.ai/blog/the-role-of-simulation-in-scalable-robotics-genesis-world-10-and-the-path-forward?x_refresh=1

Los cuatro componentes del mundo Génesis 1.0

Nyx: renderizado con seguimiento de ruta en tiempo real

Nyx es un trazador de ruta acelerado por GPU que se conecta a Genesis World como sensor de cámara. Está disponible como paquete Python gs-nyx-plugin. Los volantes prediseñados están disponibles para Linux x86-64 (manylinux 2.34+) y Windows 10/11, y requieren una GPU NVIDIA con CUDA.

Nyx apunta a cuadros de 1080p sin ruido en 4 ms o menos en una GPU de consumo de alta gama, sin horneado ni imágenes fantasma. Para alcanzar ese objetivo, utiliza un búfer de visibilidad, una arquitectura impulsada por GPU sin enlaces, MSAA, trazado de rayos por hardware, núcleos de matriz de hardware y compresión de video.

El trazado de caminos es la base: la iluminación de múltiples rebotes, las sombras suaves y la iluminación indirecta son correctas por construcción. Encima se encuentra un modelo de cámara físicamente conectado a tierra. Un tubo HDRI ilumina escenas con un brillo medido. Los activos provienen del escaneo interno y la fotogrametría. Los símbolos gaussianos 3D amplían la cobertura donde la reconstrucción de la malla es insuficiente.

Nyx se basa en la física por lotes en lugar de en la ejecución escena por escena. Esto permite que miles de implementaciones paralelas, cada una con su propio escenario, iluminación y trayectoria de cámara, pasen a través de un único canal de renderizado unificado.

Genesis World Physics: motor multifísico unificado

La plataforma de física Genesis World es de código abierto (Apache 2.0) y ejecuta multifísica en una sola tubería: cuerpos rígidos articulados (MJCF/URDF/USD), FEM para telas y deformables elásticos, MPM para materiales granulares y elastoplásticos, SPH para fluidos y PBD para telas rápidas y líquidos basados ​​en posición.

Hay tres acopladores intercambiables disponibles detrás de la misma API: un acoplador rápido de uso general; un acoplador Primal semianalítico estilo Drake con contacto hidroelástico; y un acoplador de contacto potencial incremental (IPC) para contacto libre de intersecciones en escenas deformables. El cambio entre acopladores requiere un cambio de código de una línea, sin cambios en los activos, los sensores o la interfaz de políticas.

Genesis World 1.0 introdujo dos nuevos solucionadores. La restricción de articulación externa (construida sobre libuipc) incorpora la dinámica del espacio conjunto directamente en la optimización de IPC, por lo que las fuerzas del espacio conjunto y las fuerzas de contacto se resuelven simultáneamente en lugar de escalonarse entre solucionadores separados. El segundo es la elastodinámica sin barreras, que reemplaza la barrera logarítmica del IPC con un lagrangiano aumentado personalizado. La barrera del IPC estándar hace que el hessiano esté mal acondicionado a medida que los contactos se estrechan. La formulación lagrangiana aumentada evita esto, permitiendo que cada par de contactos devueltos por la detección continua de colisiones ingrese al conjunto activo inmediatamente. El equipo de investigación informa un rendimiento hasta 103 veces más rápido que el IPC tradicional en escenas con mucho contacto, manteniendo garantías de ausencia de intersecciones.

Mejoras adicionales: nuevos sensores (nube de puntos táctil, rejilla de temperatura, proximidad), FEM implícito con solucionador Newton + CG y soporte de activos ampliado (URDF xacro, actuadores generales MuJoCo, juntas compuestas/imitadoras, restricciones de igualdad/soldadura).

Cuadrantes: compilador de Python a GPU

Quadrants es un compilador multiplataforma para simulación física acelerada por GPU, desarrollado por Genesis AI y lanzado bajo Apache 2.0. Los kernels están escritos en Python simple y compilados JIT para CPU NVIDIA CUDA, AMD ROCm, Apple Metal, Vulkan y x86/ARM64 a través de LLVM. Se bifurcó de Taichi en junio de 2025. El nombre hace referencia al dicho filosófico chino de que Taichi da origen a las Cuatro Formas (Cuadrantes).

Mejoras clave de rendimiento con respecto a Taichi ascendente: tiempo de ejecución hasta 4,6 veces más rápido en los puntos de referencia de manipulación y locomoción de Genesis. El tiempo de inicio de la caché en caliente para single_franka_envs.py se redujo de 7,2 segundos a 0,3 segundos, una aceleración de más de 10 veces. La diferenciación automática en modo inverso es ahora un ciudadano de primera clase en todos los backends, lo que hace que la simulación diferenciable sea portátil.

Los pasos físicos se registran como gráficos de un solo núcleo, lo que elimina la latencia de inicio por paso. Los núcleos independientes se ejecutan en paralelo mediante transmisiones. El álgebra lineal densa (factorización de Cholesky, resolución triangular) se compila en rutas de código bloqueadas en mosaicos de 16 × 16. Una capa de envío de rendimiento compara las variantes del kernel en la primera llamada y almacena en caché la opción más rápida por firma. Los tensores comparten la memoria del dispositivo con PyTorch a través de DLPack con interoperabilidad sin copia.

Instalación:

Interfaz de simulación

El cuarto componente es la interfaz de simulación: herramientas que conectan el motor de física, el renderizador y el compilador en un sistema utilizable para aplicaciones robóticas posteriores. Esto incluye un proceso de fotogrametría para crear gemelos digitales, un proceso automatizado para la generación de entornos programáticos (diseño de escena, selección de activos, especificación de tareas y métricas de éxito) y entornos de realizaciones cruzadas que abarcan múltiples configuraciones de robots.

Marco de evaluación

Génesis estructura la evaluación como una taxonomía de ejes de perturbación ortogonales en aproximadamente 10 dimensiones, siguiendo el marco de “Una taxonomía para evaluar políticas generalistas de manipulación de robots”:

Visual: condiciones de iluminación, perturbación de la cámara, variación del fondo Comportamiento: combinaciones de objetos invisibles, variaciones de ubicación, configuración del robot Semántico: reformulación del lenguaje, ordenamiento de subtareas, punto de vista de la cámara

Para cada eje, un parámetro varía mientras que todos los demás permanecen en valores nominales. El equipo de investigación define la robustez en un eje determinado como el rendimiento relativo retenido bajo perturbación en comparación con el entorno nominal sin perturbaciones. Los barridos de perturbación a través de puntos de control de entrenamiento en múltiples escalas de modelos requieren miles de episodios de evaluación por punto de datos. Esta escala sólo es factible porque la evaluación de la simulación se ejecuta sin hardware.

Conclusiones clave

Genesis World 1.0 tiene cuatro componentes: Nyx ​​(renderizador), Genesis World (física), Quadrants (compilador) y una interfaz de simulación. La evaluación de la simulación logra una correlación de Pearson de 0,8996 con implementaciones en hardware en 14 tareas y 200 episodios cada una. Las políticas se basan únicamente en datos del mundo real; no ingresan datos simulados en el preentrenamiento (zero-shot real-to-sim). La elastodinámica sin barreras logra una aceleración de hasta 103 veces respecto al IPC tradicional en escenas de mucho contacto. Quadrants logra un tiempo de ejecución hasta 4,6 veces más rápido en comparación con Taichi ascendente, con un inicio de caché en caliente que cae de 7,2 segundos a 0,3 segundos.

Repositorios de GitHub:

Además, no dude en seguirnos en Twitter y no olvide unirse a nuestro SubReddit de más de 150.000 ML y suscribirse a nuestro boletín. ¡Esperar! estas en telegrama? Ahora también puedes unirte a nosotros en Telegram.

¿Necesita asociarse con nosotros para promocionar su repositorio de GitHub O su página principal de Hugging O su lanzamiento de producto O seminario web, etc.? Conéctate con nosotros

Michal Sutter es un profesional de la ciencia de datos con una Maestría en Ciencias de Datos de la Universidad de Padua. Con una base sólida en análisis estadístico, aprendizaje automático e ingeniería de datos, Michal se destaca en transformar conjuntos de datos complejos en conocimientos prácticos.