Cache-to-Cache (C2C): comunicación semántica directa entre modelos de lenguajes grandes a través de KV-Cache Fusion
¿Pueden los modelos de lenguaje grandes colaborar sin enviar un solo fragmento de texto? Un equipo de investigadores de la Universidad de Tsinghua, Infinigence AI, la Universidad China de Hong…