Google presenta Gemini 3.5 Flash en I/O 2026: un modelo más rápido y económico para agentes y codificación de IA

Google acaba de lanzar Gemini 3.5 Flash en Google I/O de mayo de 2026. Es el primer modelo Gemini 3.5. La serie combina inteligencia fronteriza con acción. Google lo llama un gran salto para los agentes inteligentes. Históricamente, el nivel Flash ha sido más rápido y más económico. 3.5 Flash supera a Gemini 3.1 Pro en puntos de referencia desafiantes. El nivel premium anterior ahora ha sido superado.

Lo que dicen los puntos de referencia

Gemini 3.5 Flash obtiene una puntuación del 76,2% en Terminal-Bench 2.1. Ese punto de referencia prueba el rendimiento de la codificación. Obtiene una puntuación de 1656 Elo en GDPval-AA. Eso mide el desempeño de tareas de agencia en el mundo real. Obtiene una puntuación del 83,6% en MCP Atlas. MCP Atlas mide la confiabilidad del uso de herramientas a escala. Obtiene una puntuación del 84,2% en CharXiv Reasoning. Ese punto de referencia pone a prueba la comprensión multimodal.

Gemini 3.5 Flash es 4 veces más rápido en tokens de salida. Las tareas suelen completarse por menos de la mitad del coste. El precio oficial es de 1,50 dólares por millón de tokens de entrada. Los tokens de salida cuestan $9,00 por millón. La entrada en caché tiene un precio de 0,15 dólares por millón.

La ventana de contexto tiene 1.048.576 tokens de entrada. La producción máxima es de 65.536 tokens. Las entradas admitidas son texto, imagen, audio y vídeo. La fecha límite de conocimiento es enero de 2026. El pensamiento dinámico está activado de forma predeterminada. El modelo asigna automáticamente más computación para problemas más difíciles.

https://blog.google/innovation-and-ai/models-and-research/gemini-models/gemini-3-5/#frontier-intelligence

Creado para tareas agentesticas y de largo horizonte

Aquí, ‘Agentic’ significa los planes del modelo, las herramientas de llamadas y las iteraciones. Completa objetivos de varios pasos, no preguntas únicas. ‘Horizonte largo’ significa que el bucle se ejecuta durante períodos prolongados. Google introdujo agentes administrados en la API de Gemini. Una llamada a la API activa un agente completo. Razona, utiliza herramientas y ejecuta código. El entorno se ejecuta dentro de un contenedor Linux aislado. Los archivos y el estado persisten durante las llamadas de seguimiento. Esto permite sesiones fluidas de agentes en varios turnos.

Anteriormente, la gestión del estado y los entornos de los agentes era manual. La API de Agentes Gestionados abstrae esa infraestructura por completo.

El ecosistema antigravedad

Google Antigravity es su plataforma de desarrollo centrada en el agente. Lleva ideas a aplicaciones listas para producción. Antigravity 2.0 es una nueva aplicación de escritorio independiente. Orquesta múltiples agentes que se ejecutan en paralelo. Los subagentes dinámicos manejan flujos de trabajo en paralelo. Las tareas programadas permiten la automatización en segundo plano. Las integraciones cubren Google AI Studio, Android y Firebase.

La CLI de Antigravity es para desarrolladores basados ​​en terminales. Crea agentes al instante, sin GUI. Google anima a los usuarios de Gemini CLI a migrar ahora. El SDK de Antigravity brinda acceso programático al arnés. Puede definir comportamientos de agentes personalizados con él. Aloje agentes en la infraestructura de su elección.

Implementaciones empresariales del mundo real

Según Google, varios socios empresariales ya están ejecutando 3.5 Flash. Shopify ejecuta subagentes en paralelo para el análisis de datos. Impulsa pronósticos de crecimiento comercial más precisos a nivel mundial. Macquarie Bank lo está probando para la incorporación de clientes. El modelo analiza documentos complejos de más de 100 páginas. Recupera información y hace recomendaciones confiables.

Salesforce está integrando 3.5 Flash en Agentforce. Automatiza las tareas empresariales utilizando múltiples subagentes. Los subagentes retienen el contexto a través de llamadas de herramientas complejas de múltiples turnos. Ramp lo utiliza para un OCR más inteligente en las facturas. Combina la comprensión multimodal con el razonamiento de patrones históricos. Xero implementa agentes para flujos de trabajo complejos de varias semanas. Un ejemplo es la recopilación de datos de proveedores para los formularios 1099. Databricks utiliza flujos de trabajo agentes para el monitoreo de datos en tiempo real. El modelo diagnostica problemas y propone soluciones a los ingenieros.

Consulta los detalles técnicos. Además, no dude en seguirnos en Twitter y no olvide unirse a nuestro SubReddit de más de 150.000 ML y suscribirse a nuestro boletín. ¡Esperar! estas en telegrama? Ahora también puedes unirte a nosotros en Telegram.

¿Necesita asociarse con nosotros para promocionar su repositorio de GitHub O su página principal de Hugging O su lanzamiento de producto O seminario web, etc.? Conéctate con nosotros

Michal Sutter es un profesional de la ciencia de datos con una Maestría en Ciencias de Datos de la Universidad de Padua. Con una base sólida en análisis estadístico, aprendizaje automático e ingeniería de datos, Michal se destaca en transformar conjuntos de datos complejos en conocimientos prácticos.