Presentamos Gemma 4 12B

Hoy presentamos Gemma 4 12B, nuestro último modelo diseñado para llevar inteligencia multimodal agente directamente a las computadoras portátiles. Cerrando la brecha entre nuestro E4B amigable con el borde y nuestra Mezcla de Expertos (MoE) 26B más avanzada, Gemma 4 12B incluye potentes capacidades dentro de una huella de memoria reducida. También es nuestro primer modelo de tamaño mediano que cuenta con entradas de audio nativas.

Gracias a la comunidad de desarrolladores, los modelos Gemma 4 ya han superado los 150 millones de descargas. Ha creado de todo, desde brazos robóticos portátiles para asistencia física hasta seguridad de IA de nivel empresarial. Estamos emocionados de ver lo que construye con esta última incorporación.

A continuación se ofrece una descripción general de lo que hace que Gemma 4 12B sea única:

Nueva arquitectura unificada: sin codificadores multimodales. Las entradas de visión y audio fluyen directamente a la columna vertebral de LLM. Razonamiento avanzado: rendimiento de referencia que se acerca a nuestro modelo 26B, lo que desbloquea potentes flujos de trabajo de agentes y razonamiento de varios pasos. Listo para computadora portátil: lo suficientemente pequeño como para ejecutarse localmente con solo 16 GB de VRAM o memoria unificada. Abierto y accesible: lanzado bajo una licencia Apache 2.0 con soporte en todo el ecosistema de desarrolladores. Listo para redactar: Gemma 4 12B viene equipado con Multi-Token Redactores de predicción (MTP) para reducir la latencia.

Juntas, estas características aportan capacidades multimodales avanzadas al hardware cotidiano sin sacrificar la velocidad o el razonamiento. Veamos ahora más de cerca cómo el Gemma 4 12B logra esto.

Ejecute agentes de última generación localmente

Gemma 4 12B ofrece un rendimiento cercano a nuestro modelo MoE de 26 B más grande en los puntos de referencia estándar, pero con menos de la mitad del espacio total de memoria. Lo suficientemente pequeño como para ejecutarse localmente en computadoras portátiles de consumo con 16 GB de RAM, desbloquea potentes experiencias multimodales y agentes directamente en su máquina.