OpenAI lanza LifeSciBench, un punto de referencia de 750 tareas que califica modelos de IA en investigaciones de ciencias de la vida real con una rúbrica escrita por expertos
La mayoría de los puntos de referencia de biología plantean preguntas limitadas, basadas en hechos, con respuestas claras. Los científicos sopesan la evidencia imperfecta y toman decisiones. OpenAI lanzó LifeSciBench…