¿Pueden los modelos de lenguajes grandes manejar contextos más largos sin capacitación adicional? Este documento de IA propone SelfExtend para estimular el potencial de manejo de contextos a largo plazo de los LLM
Dentro de los modelos de lenguajes grandes (LLM), uno de los principales desafíos que enfrentan los investigadores es la necesidad de expandir la ventana de contexto para lograr el máximo…