Comience a construir con Gemini 2.0 Flash y Flash-Lite

Desde el lanzamiento de la familia de modelos Flash Gemini 2.0, los desarrolladores están descubriendo nuevos casos de uso para esta familia de modelos altamente eficiente. Gemini 2.0 Flash ofrece un rendimiento más sólido que 1.5 Flash y 1.5 Pro, además de precios simplificados que hacen que nuestra ventana de contexto de 1 millón de tokens sea más asequible.

Hoy en día, Gemini 2.0 Flash-Lite ya está disponible de forma generalizada en la API de Gemini para uso en producción en Google AI Studio y para clientes empresariales en Vertex AI. 2.0 Flash-Lite ofrece un rendimiento mejorado con respecto a 1.5 Flash en puntos de referencia de razonamiento, multimodal, matemático y factual. Para proyectos que requieren ventanas de contexto largas, 2.0 Flash-Lite es una solución aún más rentable, con precios simplificados para solicitudes de más de 128.000 tokens.

Los desarrolladores ya están aprovechando la velocidad, la eficiencia y la rentabilidad de la familia Flash 2.0 para crear aplicaciones increíbles. A continuación se muestran algunos ejemplos:

1. IA de voz

Crear una IA conversacional eficaz, en particular asistentes de voz, requiere velocidad y precisión. Un Time-to-First-Token (TTFT) rápido es esencial para crear una sensación natural y receptiva, junto con la capacidad de manejar instrucciones complejas e interactuar con otros sistemas mediante llamadas a funciones.

Daily está aprovechando Gemini 2.0 Flash-Lite para ayudar a los desarrolladores a crear experiencias de inteligencia artificial de voz de vanguardia. Utilizando su marco Pipecat de código abierto e independiente del proveedor para agentes conversacionales multimodales y de voz, Daily ha creado una demostración de código de instrucciones del sistema para detectar de manera confiable sistemas de correo de voz y adaptar los mensajes en consecuencia.

Lo sentimos, tu navegador no admite la reproducción de este vídeo.

Gemini 2.0 Flash-Lite, con las instrucciones del sistema anteriores, funciona significativamente mejor que los modelos comerciales especializados actuales para detectar mensajes de voz.

2. Análisis de datos

Dawn está revolucionando la forma en que los equipos de ingeniería monitorean sus productos de IA en producción al brindar información profunda y significativa impulsada por Gemini 2.0 Flash. El proceso de “monitoreo semántico” de Dawn permite a los equipos de ingeniería buscar instantáneamente flujos masivos de interacciones de usuarios para encontrar cualquier comportamiento que estén buscando (como la frustración del usuario, la duración de la conversación y los comentarios de los usuarios) y realizar un seguimiento continuo de ellos como problemas o temas continuos para identificar anomalías y problemas ocultos en la producción.

Con los precios simplificados, los resultados estructurados confiables y las capacidades de contexto extendido de Gemini 2.0 Flash, Dawn pudo reducir significativamente los tiempos de búsqueda (de horas a poco menos de un minuto) al cambiar de modelo, reducir los costos en más de un 90 % y ver una mayor confiabilidad en las evaluaciones y el monitoreo de la producción.

Lo sentimos, tu navegador no admite la reproducción de este vídeo.

Gemini 2.0 Flash hace que el monitoreo semántico de Dawn sea más rápido, confiable y rentable.

3. Edición de vídeo

Mosaic está transformando tareas de edición de vídeo complejas y que consumen mucho tiempo con un nuevo paradigma agente que utiliza Gemini 2.0 Flash. Su solución incorpora agentes de edición multimodal que utilizan las capacidades de contexto largo de Gemini 2.0 Flash para acelerar las tareas mundanas de edición de video de horas a segundos para que pueda hacer cosas como recortar cortos de YouTube de cualquier parte de un video de formato largo con solo un mensaje.

El nuevo precio simplificado para Gemini 2.0 Flash de 0,10 dólares por cada millón de tokens de entrada en Google AI Studio hace que las ventanas contextuales enormes sean un 33 % más asequibles, abriendo nuevas posibilidades para los flujos de trabajo de edición de vídeo impulsados ​​por IA.

Usando Gemini 2.0 Flash, el flujo de trabajo agente de Mosaic corta y edita un corto de YouTube de un episodio reciente de Notas de la versión.

Comience a construir con Gemini 2.0 Flash y 2.0 Flash-Lite

Estamos entusiasmados con lo que la familia de modelos Gemini 2.0 Flash está permitiendo a desarrolladores como Daily.co, Mosaic y Dawn. Ya sea que esté trabajando en asistentes de voz, herramientas de edición de video o algo completamente nuevo, esperamos que la familia Gemini 2.0 Flash le brinde el rendimiento y la asequibilidad que necesita. Comience a construir hoy en Google AI Studio.