DeepSeek-AI acaba de lanzar DeepSeek-V3: un sólido modelo de lenguaje de mezcla de expertos (MoE) con 671 B de parámetros totales con 37 B activados para cada token
El campo del procesamiento del lenguaje natural (PLN) ha logrado avances significativos con el desarrollo de modelos de lenguaje a gran escala (LLM). Sin embargo, este progreso ha traído su…