Los investigadores de Stanford introdujeron Medagentbench: un punto de referencia del mundo real para los agentes de IA de la salud
Un equipo de investigadores de la Universidad de Stanford ha publicado Bobina de mediciónuna nueva suite de referencia diseñada para evaluar a los agentes del Modelo de Lengua Grande (LLM)…