Hoy, estamos lanzando la versión estable de Gemini 2.5 Flash-Lite, nuestro modelo más rápido y más bajo de costo ($ 0.10 por 1M, $ 0.40 por 1 m) en la familia del modelo Gemini 2.5. Construimos 2.5 flash-lite para impulsar la frontera de inteligencia por dólar, con capacidades de razonamiento nativas que se pueden alternar opcionalmente para casos de uso más exigentes. Sobre la base del impulso de 2.5 Pro y 2.5 flash, este modelo redondea nuestro conjunto de 2.5 modelos listos para el uso de producción a escala.
Nuestro modelo 2.5 más rentable y más rápido hasta ahora
Gemini 2.5 Flash-Lite entera un equilibrio entre el rendimiento y el costo, sin comprometer la calidad, particularmente para tareas sensibles a la latencia como la traducción y la clasificación.
Esto es lo que lo hace destacar:
- La mejor velocidad en la clase: Gemini 2.5 Flash-Lite tiene una latencia más baja que 2.0 Flash-Lite y 2.0 Flash en una amplia muestra de indicaciones.
- Rentabilidad: Es nuestro modelo 2.5 de menor costo hasta ahora, con un precio de tokens de entrada de $ 0.10 / 1M y tokens de salida de $ 0.40, lo que le permite manejar grandes volúmenes de solicitudes de manera asequible. También hemos reducido el precio de entrada de audio en un 40% desde el lanzamiento de la vista previa.
- Inteligente y pequeño: Demuestra una calidad más alta que 2.0 Flash-Lite en una amplia gama de puntos de referencia, incluyendo codificación, matemáticas, ciencias, razonamiento y comprensión multimodal.
- Totalmente destacado: Cuando construye con 2.5 flash-lite, obtiene acceso a una ventana de contexto de 1 millón de token, presupuestos de pensamiento controlable y soporte para herramientas nativas como la base con la búsqueda de Google, la ejecución del código y el contexto de URL.
Géminis 2.5 Flash-Lite en acción
Desde el lanzamiento de 2.5 Flash-Lite, ya hemos visto algunas implementaciones increíblemente exitosas, estos son algunos de nuestros favoritos:
- Satia está construyendo una plataforma de computación espacial descentralizada que transformará cómo se procesan y utilizan los datos satelitales para el resumen en tiempo real de la telemetría en órbita, la gestión de tareas autónomas y el análisis de comunicación por satélite a satélite. 2.5 La velocidad de Flash-Lite ha habilitado una reducción del 45% en la latencia para diagnósticos críticos a bordo y un 30% de disminución en el consumo de energía en comparación con sus modelos de referencia.
- Heygen Utiliza AI para crear avatares para contenido de video y aprovecha Gemini 2.5 Flash-Lite para automatizar la planificación de video, analizar y optimizar el contenido, y Traducir videos en más de 180 idiomas. Esto les permite proporcionar experiencias globales y personalizadas para sus usuarios.
- Doctorado convierte las demostraciones de productos en documentación utilizando Gemini 2.5 Flash-Lite para procesar videos largos y extraer miles de capturas de pantalla con baja latencia. Esto transforma el video en documentación integral y datos de capacitación para agentes de IA mucho más rápido que los métodos tradicionales.
- Evertune Ayuda a las marcas a comprender cómo se representan en los modelos de IA. Gemini 2.5 Flash-Lite es un cambio de juego para ellos, acelerando drásticamente el análisis y la generación de informes. Su rendimiento rápido les permite escanear y sintetizar rápidamente grandes volúmenes de salida del modelo para proporcionar a los clientes ideas dinámicas y oportunas.
Puede comenzar a usar 2.5 Flash-Lite especificando “Gemini-2.5-Flash-Lite” en su código. Si está utilizando la versión de vista previa, puede cambiar a “Gemini-2.5-Flash-Lite”, que es el mismo modelo subyacente. Planeamos eliminar el alias de vista previa de Flash-Lite el 25 de agosto.
¿Listo para comenzar a construir? Prueba la versión estable de Gemini 2.5 Flash-Lite ahora en Google AI Studio y Vertex ai.