Los últimos meses han sido emocionantes para la familia de modelos abiertos Gemma. Presentamos Gemma 3 y Gemma 3 QAT, que ofrecen un rendimiento de última generación para aceleradores de escritorio y de nube única. Luego, anunciamos el lanzamiento completo de Gemma 3n, una arquitectura móvil que ofrece IA multimodal potente y en tiempo real directamente a los dispositivos de borde. Nuestro objetivo ha sido proporcionar herramientas útiles para que los desarrolladores construyan con IA, y seguimos sorprendidos por el vibrante Gemmaverse que estás ayudando a crear, y celebramos juntos que las descargas superaron los 200 millones la semana pasada.
Hoy, estamos agregando una herramienta nueva y altamente especializada al conjunto de herramientas de Gemma 3: Gemma 3 270M, un modelo compacto de 270 millones de parámetros diseñado desde cero para realizar ajustes específicos de tareas con sólidas capacidades de estructuración de texto y seguimiento de instrucciones ya entrenadas.
Gemma 3 270M ofrece sólidas capacidades de seguimiento de instrucciones a un modelo de tamaño reducido. Como lo muestra el punto de referencia IFEval (que prueba la capacidad de un modelo para seguir instrucciones verificables), establece un nuevo nivel de rendimiento para su tamaño, lo que hace que las capacidades sofisticadas de IA sean más accesibles para aplicaciones de investigación y en el dispositivo.
Capacidades principales del Gemma 3 270M
Arquitectura compacta y capaz: nuestro nuevo modelo tiene un total de 270 millones de parámetros: 170 millones de parámetros integrados debido al gran tamaño del vocabulario y 100 millones para nuestros bloques transformadores. Gracias al amplio vocabulario de tokens de 256k, el modelo puede manejar tokens específicos y raros, lo que lo convierte en un modelo base sólido que se puede perfeccionar en dominios e idiomas específicos. Eficiencia energética extrema: una ventaja clave de Gemma 3 270M es su bajo consumo de energía. Las pruebas internas en un SoC Pixel 9 Pro muestran que el modelo cuantificado INT4 usó solo el 0,75 % de la batería para 25 conversaciones, lo que lo convierte en nuestro modelo Gemma con mayor eficiencia energética. Instrucción siguiente: se lanza un modelo sintonizado con instrucciones junto con un punto de control previamente entrenado. Si bien este modelo no está diseñado para casos de uso conversacionales complejos, es un modelo sólido que sigue instrucciones generales desde el primer momento.
En ingeniería, el éxito se define por la eficiencia, no sólo por la potencia bruta. No usarías un mazo para colgar un marco de fotos. El mismo principio se aplica a la construcción con IA.
Gemma 3 270M encarna esta filosofía de “herramienta adecuada para el trabajo”. Es un modelo básico de alta calidad que sigue las instrucciones desde el primer momento y su verdadero poder se desbloquea mediante ajustes finos. Una vez especializado, puede ejecutar tareas como clasificación de texto y extracción de datos con notable precisión, velocidad y rentabilidad. Al comenzar con un modelo compacto y capaz, puede construir sistemas de producción que sean ágiles, rápidos y mucho más baratos de operar.
Un plan del mundo real para el éxito
El poder de este enfoque ya ha dado resultados increíbles en el mundo real. Un ejemplo perfecto es el trabajo realizado por Adaptive ML con SK Telecom. Ante el desafío de la moderación de contenido multilingüe y matizado, decidieron especializarse. En lugar de utilizar un modelo masivo de uso general, Adaptive ML perfeccionó un modelo Gemma 3 4B. Los resultados fueron sorprendentes: el modelo especializado Gemma no sólo alcanzó, sino que superó el rendimiento de modelos propietarios mucho más grandes en su tarea específica.
Gemma 3 270M está diseñado para permitir a los desarrolladores llevar este enfoque aún más lejos, desbloqueando una eficiencia aún mayor para tareas bien definidas. Es el punto de partida perfecto para crear una flota de modelos pequeños y especializados, cada uno de ellos experto en su propia tarea.
Pero este poder de especialización no es sólo para tareas empresariales; también permite potentes aplicaciones creativas. Por ejemplo, consulte esta aplicación web Bedtime Story Generator:
Gemma 3 270M solía alimentar una aplicación web Bedtime Story Generator usando Transformers.js. El tamaño y el rendimiento del modelo lo hacen adecuado para tareas creativas fuera de línea y basadas en la web. (Crédito: Joshua (@xenovacom en X) del equipo de Hugging Face)
Cuándo elegir Gemma 3 270M
Gemma 3 270M hereda la arquitectura avanzada y el sólido entrenamiento previo de la colección Gemma 3, lo que proporciona una base sólida para sus aplicaciones personalizadas.
Aquí es cuando es la elección perfecta:
Tienes una tarea de gran volumen y bien definida. Ideal para funciones como análisis de opiniones, extracción de entidades, enrutamiento de consultas, procesamiento de texto estructurado a no estructurado, escritura creativa y comprobaciones de cumplimiento. Debe aprovechar cada milisegundo y microcéntimos. Reduzca drásticamente o elimine sus costos de inferencia en producción y brinde respuestas más rápidas a sus usuarios. Un modelo 270M optimizado puede ejecutarse en una infraestructura liviana y económica o directamente en el dispositivo. Es necesario iterar e implementar rápidamente. El pequeño tamaño de Gemma 3 270M permite realizar experimentos de ajuste rápidos, lo que le ayuda a encontrar la configuración perfecta para su caso de uso en horas, no en días. Debe garantizar la privacidad del usuario. Debido a que el modelo puede ejecutarse completamente en el dispositivo, puede crear aplicaciones que manejen información confidencial sin tener que enviar datos a la nube. Quiere una flota de modelos de tareas especializados. Cree e implemente múltiples modelos personalizados, cada uno de ellos capacitado por expertos para una tarea diferente, sin exceder su presupuesto.
Comience con el ajuste fino
Queremos que convertir Gemma 3 270M en su propia solución personalizada sea lo más fácil posible. Está construido sobre la misma arquitectura que el resto de los modelos Gemma 3, con recetas y herramientas para que puedas empezar rápidamente. Puede encontrar nuestra guía sobre el ajuste completo con Gemma 3 270M como parte de los documentos de Gemma.
Gemmaverse se basa en la idea de que la innovación viene en todos los tamaños. Con Gemma 3 270M, estamos capacitando a los desarrolladores para que creen soluciones de IA más inteligentes, más rápidas y más eficientes. Estamos ansiosos por ver los modelos especializados que cree.