WTU-Eval: una nueva herramienta de referencia estándar para evaluar las capacidades de uso de los LLM de modelos lingüísticos de gran tamaño
Los modelos de lenguaje grande (LLM) se destacan en diversas tareas, incluidas la generación de texto, la traducción y el resumen. Sin embargo, un desafío cada vez mayor dentro del…