Atención por franjas horarias cerradas: avances en los modelos de atención lineal para un procesamiento del lenguaje eficiente y eficaz
Los modelos de transformadores han revolucionado las tareas de modelado de secuencias, pero su mecanismo de atención estándar enfrenta desafíos significativos cuando se trata de secuencias largas. La complejidad cuadrática…