En agosto, presentamos una vista previa de Genie 3, un modelo mundial de propósito general capaz de generar entornos diversos e interactivos. Incluso en esta forma inicial, los evaluadores confiables pudieron crear una impresionante variedad de mundos y experiencias fascinantes, y descubrieron formas completamente nuevas de usarlo. El siguiente paso es ampliar el acceso a través de un prototipo interactivo dedicado centrado en la creación de mundos inmersivos.
A partir de hoy, implementaremos el acceso a Project Genie para los suscriptores de Google AI Ultra en los EE. UU. (mayores de 18 años). Este prototipo de investigación experimental permite a los usuarios crear, explorar y remezclar sus propios mundos interactivos.
Cómo estamos avanzando en los modelos mundiales
Un modelo mundial simula la dinámica de un entorno, prediciendo cómo evolucionan y cómo les afectan las acciones. Si bien Google DeepMind tiene un historial de agentes para entornos específicos como Chess o Go, la creación de AGI requiere sistemas que naveguen por la diversidad del mundo real.
Para afrontar este desafío y respaldar nuestra misión AGI, desarrollamos Genie 3. A diferencia de las experiencias explorables en instantáneas estáticas en 3D, Genie 3 genera el camino a seguir en tiempo real a medida que te mueves e interactúas con el mundo. Simula la física y las interacciones para mundos dinámicos, mientras que su innovadora consistencia permite la simulación de cualquier escenario del mundo real, desde robótica y modelado de animación y ficción, hasta exploración de ubicaciones y escenarios históricos.
Basándonos en nuestra investigación de modelos con evaluadores confiables de todas las industrias y dominios, estamos dando el siguiente paso con un prototipo de investigación experimental: Project Genie.
Cómo funciona el Proyecto Genio
Project Genie es un prototipo de aplicación web impulsado por Genie 3, Nano Banana Pro y Gemini, que permite a los usuarios experimentar de primera mano las experiencias inmersivas de nuestro modelo mundial. La experiencia se centra en tres capacidades principales: