Los investigadores de Qwen presentan CodeElo: un punto de referencia de IA diseñado para evaluar las habilidades de codificación a nivel de competencia de los LLM utilizando calificaciones Elo comparables a las humanas
Los modelos de lenguajes grandes (LLM) han aportado avances significativos a las aplicaciones de IA, incluida la generación de código. Sin embargo, evaluar sus verdaderas capacidades no es sencillo. Los…