Géminis como asistente universal de IA

Durante la última década, hemos sentado muchas bases para la era moderna de la IA, desde ser pioneros en la arquitectura Transformer en la que se basan todos los grandes modelos de lenguaje, hasta desarrollar sistemas de agentes que pueden aprender y planificar como AlphaGo y AlphaZero.

Hemos aplicado estas técnicas para lograr avances en la computación cuántica, las matemáticas, las ciencias biológicas y el descubrimiento algorítmico. Y continuamos duplicando la amplitud y profundidad de nuestra investigación fundamental, trabajando para inventar los próximos grandes avances necesarios para la inteligencia artificial general (AGI).

Es por eso que estamos trabajando para ampliar nuestro mejor modelo básico multimodal, Gemini 2.5 Pro, para convertirlo en un “modelo mundial” que pueda hacer planes e imaginar nuevas experiencias al comprender y simular aspectos del mundo, tal como lo hace el cerebro.

Hemos estado avanzando en esta dirección durante un tiempo, desde nuestros agentes pioneros en capacitación laboral para dominar juegos complejos como Go y StarCraft, hasta la construcción de Genie 2, que es capaz de generar entornos simulados en 3D con los que puedes interactuar, a partir de una sola imagen.

Ya podemos ver evidencia de estas capacidades emergentes en la capacidad de Gemini de utilizar el conocimiento y el razonamiento mundial para representar y simular entornos naturales, la profunda comprensión de Veo de la física intuitiva y la forma en que Gemini Robotics enseña a los robots a agarrar, seguir instrucciones y ajustarse sobre la marcha.

Hacer de Gemini un modelo mundial es un paso crítico en el desarrollo de un tipo de IA nuevo, más general y más útil: un asistente de IA universal. Se trata de una IA que es inteligente, comprende el contexto en el que se encuentra y que puede planificar y tomar medidas en su nombre, en cualquier dispositivo.