AGENTBOARD - 7 minutos

Thu. Jul 16th, 2026

Inteligencia artificial

Este documento de IA de China presenta ‘AGENTBOARD’: un marco de evaluación de código abierto adaptado a la evaluación analítica de agentes LLM de múltiples turnos

February 1, 2024 Equipo de 7 minutos

Evaluar los LLM como agentes versátiles es crucial para su integración en aplicaciones prácticas. Sin embargo, los marcos de evaluación existentes enfrentan desafíos al comparar diversos escenarios, mantener entornos parcialmente…

You missed

Inteligencia artificial

Thinking Machines Lab lanza Inkling: un MoE multimodal de peso abierto con parámetros 975B con parámetros activos 41B y esfuerzo de pensamiento controlable

July 15, 2026 Equipo de 7 minutos

Los científicos descubren una nueva especie de mono “notable” con labios anaranjados y un rugido parecido al de una rana

July 15, 2026 Equipo de 7 minutos

ICE sigue disparando a la gente. Aquí hay una manera en que el Congreso puede controlarlo.

July 15, 2026 Equipo de 7 minutos

Emprendimiento españa

British Business Bank añade un acuerdo de 58 millones de euros en Soho Square a su reciente serie de inversiones en el Reino Unido

July 15, 2026 Equipo de 7 minutos