Durante la última década, hemos puesto muchas de las bases para la era moderna de la IA, de pionero en el Transformador arquitectura en la que se basan todos los modelos de idiomas grandes, a los sistemas de agentes en desarrollo que pueden aprender y planificar como Alfago y Alphazero.
Hemos aplicado estas técnicas para hacer avances en computación cuántica, matemáticas, Ciencias de la vida y descubrimiento algorítmico. Y continuamos duplicando la amplitud y profundidad de nuestra investigación fundamental, trabajando para inventar los próximos grandes avances necesarios para la inteligencia general artificial (AGI).
Es por eso que estamos trabajando para extender nuestro mejor modelo de base multimodal, Gemini 2.5 Pro, para convertirse en un “modelo mundial” que puede hacer planes e imaginar nuevas experiencias al comprender y simular aspectos del mundo, tal como lo hace el cerebro.
Hemos estado avanzando en esta dirección por un tiempo, desde nuestros agentes de entrenamiento de trabajo pioneros hasta dominar juegos complejos como Ir y Estrellaal edificio Genio 2que es capaz de generar entornos simulados 3D con los que puede interactuar, a partir de un solo mensaje de imagen.
Ya podemos ver evidencia de estas capacidades que surgen en la capacidad de Géminis para usar el conocimiento y el razonamiento mundial para representar y simular entornos naturales, VeroLa comprensión profunda de la física intuitiva y la forma Robótica de Géminis enseña a los robots a comprender, seguir instrucciones y ajustar sobre la marcha.
Hacer de Géminis un modelo mundial es un paso crítico para desarrollar un tipo de IA nuevo, más general y más útil: un asistente de IA universal. Esta es una IA que es inteligente, comprende el contexto en el que se encuentra y que puede planificar y tomar medidas en su nombre, en cualquier dispositivo.