Vista mecanicista de los transformadores: patrones, mensajes, flujo residual … y LSTMS
mi anterior artículoHablé sobre cómo la interpretabilidad mecanicista reinventa la atención en un transformadores para ser aditivos sin ninguna concatenación. Aquí, profundizaré en esta perspectiva y mostraré cómo resuena con…