PaperBench de comunicados de IA abiertos: un punto de referencia desafiante para evaluar las habilidades de los agentes de IA para replicar la investigación de aprendizaje automático de vanguardia
El rápido progreso en la investigación de inteligencia artificial (IA) y aprendizaje automático (ML) subraya la importancia de evaluar con precisión las capacidades de los agentes de IA en la…