Google Deepmind Research presenta Questbench: Evaluación de la capacidad de LLM para identificar información faltante en tareas de razonamiento
Los modelos de idiomas grandes (LLM) han ganado una tracción significativa en las tareas de razonamiento, incluidas las matemáticas, la lógica, la planificación y la codificación. Sin embargo, surge un…