Google DeepMind lanza Gemma 4 12B: un modelo multimodal sin codificador con audio nativo que se ejecuta en una computadora portátil de 16 GB
Google DeepMind acaba de lanzar Gemma 4 12B, un modelo multimodal denso que elimina por completo los codificadores tradicionales. La visión y el audio fluyen directamente hacia la columna vertebral…