Este artículo de IA de Apple presenta una ley de escala de destilación: un enfoque óptimo de cómputo para capacitar modelos de lenguaje eficientes
Los modelos de idiomas se han vuelto cada vez más caros de entrenar y desplegar. Esto ha llevado a los investigadores a explorar técnicas como la destilación del modelo, donde…