Google AI lanza redactores de predicción de tokens múltiples (MTP) para Gemma 4: ofrece una inferencia hasta 3 veces más rápida sin pérdida de calidad
Los modelos de lenguaje grandes se están volviendo increíblemente poderosos, pero seamos honestos: su velocidad de inferencia sigue siendo un gran dolor de cabeza para cualquiera que intente usarlos en…