Nvidia AI presenta una pila de IA de extremo a extremo, modelos de IA físicos de Cosmos y nuevas bibliotecas omniversas para robótica avanzada

Nvidia hizo olas importantes en Siggraph 2025 al presentar un conjunto de nuevos modelos mundiales de Cosmos, bibliotecas de simulación robustas e infraestructura de vanguardia, todos diseñados para acelerar la próxima era de IA física para robótica, vehículos autónomos y aplicaciones industriales. Desglosemos los detalles tecnológicos, lo que esto significa para los desarrolladores y por qué es importante para el futuro de la inteligencia y la simulación encarnada.

Cosmos World Foundation Models: razonamiento para robots

Razón del cosmos: modelo en idioma de visión para IA física

En el corazón del anuncio está Razón del cosmosUn modelo de languaje de visión de razonamiento de 7 billones de parámetros. Esta IA está diseñada para robots y agentes encarnados que abordan tareas del mundo real:

  • Conciencia de memoria y física: La razón de Cosmos incorpora la memoria avanzada para el razonamiento espacial y temporal, más una comprensión de las leyes físicas. Esto permite que los robots y los agentes de IA realmente “planifiquen” las acciones paso a paso en entornos complejos, lo que lo hace ideal para curación de datos, planificación de robots y análisis de video.
  • Capacidad de planificación: El modelo alimenta los datos estructurados de video y sensor (como mapas de segmentación y lidar) a un motor de razonamiento que decide qué mueve un agente debe tomar a continuación. Apoya tanto el análisis de instrucciones de alto nivel como la generación de acción de bajo nivel, imitando la lógica de forma humana para la navegación y la manipulación.

Modelos de transferencia de cosmos: generación de datos sintéticos de turbocompresión

  • Cosmos Transfer-2: Acelera la generación de conjuntos de datos sintéticos de escenas de simulación 3D o entradas de control espacial, reduciendo enormemente el tiempo y el costo para producir datos realistas de entrenamiento de robots. Esto es especialmente útil para el aprendizaje de refuerzo y la validación del modelo de política, donde los casos de borde, la iluminación diversa y los escenarios meteorológicos deben modelarse a escala.
  • Variante de transferencia destilada: Optimizado para la velocidad, permitiendo a los desarrolladores iterar rápidamente en la creación del conjunto de datos.

Impacto práctico

La familia Cosmos WFM abarca tres categorías (Nano, Super, Ultra), que van desde 4 mil millones a 14 mil millones de parámetros, y se puede ajustar para una latencia variada, fidelidad y casos de uso desde la transmisión en tiempo real hasta la representación fotorrealista.

Simulación y renderizado de bibliotecas: creación de mundos virtuales para la capacitación

Nvidia Omniverso La plataforma obtiene una actualización importante, agregando:

  • Bibliotecas de reconstrucción neural: Estas herramientas permiten a los desarrolladores importar datos del sensor y simular el mundo físico en 3D con fotorrealismo realista, impulsado por técnicas de representación neuronal.
  • Integración con OpenUSD y Carla Simulator: La adición de nuevas herramientas de conversión y capacidades de representación ayuda a estandarizar flujos de trabajo de simulación complejos, lo que facilita la interoperación entre marcos de robótica (como Mujoco) y la tubería basada en USD de NVIDIA.
  • Biblioteca de materiales SimReady: Ofrece miles de materiales de sustrato para crear entornos virtuales altamente realistas, lo que aumenta la fidelidad del entrenamiento y la simulación de la robótica.

Isaac Sim 5.0.0: El motor de simulación de NVIDIA ahora incluye modelos de actuador mejorados, soporte más amplio de Python y ROS, y nueva representación neuronal para mejores datos sintéticos.

Infraestructura para flujos de trabajo de robótica

  • Servidores RTX Pro Blackwell: Se construye un propósito para cargas de trabajo de desarrollo robótico, proporcionando arquitectura unificada para tareas de simulación, capacitación e inferencia.
  • Cloud DGX: Permite la gestión basada en la nube y la escala de los flujos de trabajo de IA físicos, para que los equipos puedan desarrollar, entrenar y desplegar agentes de IA de forma remota.

Adopción de la industria e innovación abierta

Los líderes de la industria, incluidos dispositivos amazonos, robótica de agilidad, figura ai, Uber, Dinámica de Boston y más, ya están probando modelos Cosmos y herramientas omniversas para generar datos de capacitación, construir gemelos digitales y acelerar el despliegue de robótica en la fabricación, transporte y logística.

Los modelos Cosmos están ampliamente disponibles a través de los catálogos de API y desarrolladores de NVIDIA, con una licencia permisiva que respalda tanto la investigación como el uso comercial.

Una nueva era para la IA física

La visión de Nvidia es clara: la IA física es un desafío de pila completa, que exige modelos más inteligentes, una simulación más rica e infraestructura escalable. Con la suite del modelo Cosmos, las bibliotecas Omniverse y los servidores con alimentación de Blackwell, Nvidia está cerrando la brecha entre la capacitación virtual y la implementación del mundo real, reduciendo los costosos juicio y error y desbloqueando nuevos niveles de autonomía para robots y agentes inteligentes.


Mira el Artículo técnico del blog Nvidia. No dude en ver nuestro Página de Github para tutoriales, códigos y cuadernos. Además, siéntete libre de seguirnos Gorjeo Y no olvides unirte a nuestro Subreddit de 100k+ ml y suscribirse a Nuestro boletín.


Michal Sutter es un profesional de la ciencia de datos con una Maestría en Ciencias en Ciencias de Datos de la Universidad de Padova. Con una base sólida en análisis estadístico, aprendizaje automático e ingeniería de datos, Michal se destaca por transformar conjuntos de datos complejos en ideas procesables.