Investigadores de la Universidad McGill presentan el modelo Pythia 70M para destilar transformadores en modelos de convolución larga
La aparición de modelos de lenguaje grandes (LLM) ha transformado el panorama del procesamiento del lenguaje natural (PLN). La introducción de la arquitectura transformadora marcó un momento crucial y marcó…