Deepseek v3.2-Exp reduce los costos de contexto largo con una atención escasa de Deepseek (DSA) mientras mantiene la paridad de referencia
Deepseek lanzó Deepseek-V3.2-Exp, una actualización “intermedia” a V3.1 que agrega Deepseek Sparse Attence (DSA), una ruta de dispersión entrenable dirigida a la eficiencia de contexto a largo plazo. Deepseek también…