Secuencia de atención lineal paralela (LASP): un método eficiente de aprendizaje automático adaptado a modelos de lenguaje lineales basados en la atención
Los modelos lineales basados en atención están ganando atención por su velocidad de procesamiento más rápida y su rendimiento comparable al de los transformadores Softmax. Sin embargo, los modelos de…