Herramienta de envíos de agentes Hermes Búsqueda de MCP: las evaluaciones antrópicas muestran una ganancia de precisión del 49% al 74% en Opus 4

El Hermes Agent de código abierto de Nous Research ahora incluye una función de búsqueda de herramientas. Aborda directamente un cuello de botella cada vez mayor en los sistemas de agentes de IA: demasiadas herramientas MCP llenan la ventana contextual. En este artículo explicativo, desglosaremos qué hace la búsqueda de herramientas, cómo funciona y cuándo usarla.

El problema: las herramientas MCP se están comiendo su ventana contextual

Cuando conecta varios servidores MCP (Protocolo de contexto de modelo) a un agente de IA, el esquema JSON de cada herramienta se envía al modelo en cada turno. Esto sucede incluso si el modelo sólo necesita una o dos herramientas para una tarea determinada.

Las implementaciones en el mundo real sienten esto de inmediato. Una implementación de Hermes con cinco servidores MCP y 34 herramientas muestra tamaños de aviso promedio de 45.000 tokens por turno. Aproximadamente 22.000 de esos tokens (alrededor del 50%) son solo sobrecargas de esquemas de herramientas.

Los propios datos de ingeniería de Anthropic muestran que las definiciones de herramientas pueden consumir 134.000 tokens antes de la optimización. Tool Attention mide el “impuesto a las herramientas MCP” entre 15 000 y 60 000 tokens por turno para implementaciones típicas de múltiples servidores.

Esto crea dos problemas distintos:

Costo: Las generaciones sin caché al inicio de la sesión pueden costar entre $0,07 y $0,10 por turno. Pérdida de precisión: la parálisis de decisiones se produce cuando el modelo ve cientos de opciones de herramientas irrelevantes simultáneamente.

Fuente: hermes-agent.nousresearch.com/docs · Nous Research 2026

Tool Search es la capa de divulgación progresiva opcional de Hermes Agent para MCP y herramientas de complementos no principales. En lugar de cargar cada esquema de herramientas por adelantado, el modelo carga solo lo que necesita, según demanda, por turno.

Cuando se activa la búsqueda de herramientas, las herramientas MCP y de complemento se reemplazan en la matriz de herramientas visibles del modelo por tres herramientas puente:

tool_search(consulta, ¿límite?): busca en el catálogo de herramientas diferidas. tool_describe(nombre): carga el esquema completo para una herramienta. tool_call(nombre, argumentos): invoca una herramienta diferida.

Una interacción típica se ve así:

Modelo: tool_search(“crear un problema de github”) → {coincidencias: [{ name: “mcp_github_create_issue”, … }] } Modelo: tool_describe(“mcp_github_create_issue”) → { parámetros: { tipo: “objeto”, propiedades: { … } } } Modelo: tool_call(“mcp_github_create_issue”, { título: “…”, cuerpo: “…” }) → { ok: true, número_edición: 42 }

El modelo busca lo que necesita, carga el esquema y luego llama a la herramienta. Todos los ganchos, barandillas y solicitudes de aprobación se ejecutan en función del nombre real de la herramienta subyacente, no en función del puente.

Los números de precisión

Esta no es sólo una función para guardar tokens. Tool Search también mejora la precisión del modelo en las evaluaciones de MCP.

Según las evaluaciones internas de MCP de Anthropic:

Claude Opus 4: precisión mejorada del 49 % → 74 % con la búsqueda de herramientas habilitada Claude Opus 4.5: precisión mejorada del 79,5 % → 88,1 % con la búsqueda de herramientas habilitada

Los grandes catálogos de herramientas crean una “parálisis de decisiones”: el modelo se confunde al elegir entre muchas opciones irrelevantes. Eliminar esas opciones de la ventana contextual reduce los falsos positivos. Los datos de Anthropic también muestran una reducción del 85% en el uso de tokens de definición de herramientas mientras se mantiene el acceso a la biblioteca de herramientas completa.

Cómo funciona la recuperación: BM25 + Fallback

Debajo del capó, Hermes utiliza BM25, un algoritmo clásico de recuperación de información, para hacer coincidir la consulta del modelo con un catálogo de nombres de herramientas, descripciones y nombres de parámetros.

Si BM25 no arroja resultados positivos, el sistema recurre a una coincidencia literal de subcadena en el nombre de la herramienta. Esto protege contra casos degenerados de IDF cero, como la búsqueda de “github” en un catálogo donde cada nombre de herramienta contiene “github”.

El catálogo no tiene estado en todos los turnos. Se reconstruye a partir de la lista actual de definiciones de herramientas en cada ensamblaje. Esto evita errores de deriva en los que un catálogo almacenado no está sincronizado con el registro de herramientas en vivo.

De forma predeterminada, la búsqueda de herramientas se ejecuta en modo automático. Se activa solo cuando los esquemas de herramientas aplazables consumen al menos el 10 % de la ventana de contexto del modelo activo.

Por debajo de ese umbral, el conjunto de herramientas es un puro paso a través. No pagas gastos generales.

Esta decisión se reevalúa en cada turno:

Es posible que una sesión con solo unas pocas herramientas MCP y un modelo de contexto largo nunca active la búsqueda de herramientas. Una sesión con muchos servidores MCP conectados (normalmente más de 15 herramientas) comienza a activarla. Al quitar correctamente los servidores a mitad de sesión, se vuelve a la exposición directa de la herramienta en el siguiente ensamblaje.

Referencia de configuración

Agregue esto a su hermes.yaml para controlar el comportamiento:

herramientas: herramienta_búsqueda: habilitado: auto # auto (predeterminado), activado o desactivado umbral_pct: 10 # % del contexto en el que se activa el modo automático search_default_limit: 5 max_search_limit: 20

KeyDefaultMeaningenabledautoauto se activa por encima del umbral; on siempre se activa si hay al menos una herramienta aplazable; off deshabilita completamentethreshold_pct10Porcentaje de longitud del contexto en el que se activa automáticamente. Rango: 0–100search_default_limit5Accesos devueltos cuando el modelo llama a tool_search sin un límitemax_search_limit20Límite superior estricto que el modelo puede solicitar a través del límite. Rango: 1–50

También puedes usar una taquigrafía booleana simple:

herramientas: tool_search: true # equivalente a {enabled: auto}

Explicador visual de Marktechpost

Nous Research — Agente Hermes
01 / 07

Búsqueda de herramientas: solución del problema de la ventana de contexto de MCP

Cuando varios servidores MCP se conectan a un agente, el esquema JSON de cada herramienta se carga en el contexto del modelo en cada turno, incluso cuando solo se necesita una herramienta. La herramienta de búsqueda del agente Hermes soluciona este problema con la divulgación progresiva del esquema.

~22K
fichas/girar por encima de la cabeza
en una configuración de 5 servidores y 34 herramientas

85%
reducción en la definición de herramientas
uso de tokens (datos antrópicos)

134K
tokens consumidos por las definiciones de herramientas
antes de la optimización (antrópico)

El problema
02 / 07

El impuesto a las herramientas MCP

Cada servidor MCP conectado descarga su esquema JSON completo en contexto por adelantado. Con varios servidores, esto desplaza la conversación real y obliga al modelo a elegir entre cientos de herramientas irrelevantes, lo que provoca una parálisis en la toma de decisiones.

El artículo de investigación arXiv 2604.21816 (“Atención a las herramientas”) mide el impuesto a las herramientas MCP entre 15.000 y 60.000 tokens por turno. Las sesiones sin caché pueden costar entre 0,07 y 0,10 dólares por turno en gasto de API.

GitHub: 35 herramientas: ~26.000 tokens
Slack: 11 herramientas – ~21.000 tokens
Jira: ~17.000 tokens solos

Una configuración de cinco servidores se acerca a una sobrecarga de tokens de más de 100 000 antes de que comience la conversación.

Qué es
03 / 07

Búsqueda de herramientas: una capa de divulgación progresiva

Tool Search es la función opcional de Hermes Agent que reemplaza todos los esquemas de herramientas MCP en la matriz de herramientas visibles del modelo con solo tres herramientas puente livianas. El modelo carga el esquema de cada herramienta según demanda, solo cuando realmente lo necesita.

herramienta_búsqueda (consulta, ¿límite?)
descripción_herramienta(nombre)
herramienta_call(nombre, argumentos)

Todos los ganchos, barreras de seguridad y mensajes de aprobación aún se ejecutan, con el nombre real de la herramienta subyacente, no con el puente. La fuente de actividad de CLI también se abre para mostrar la herramienta real, no el puente.

Cómo funciona
04 / 07

La secuencia de recuperación de tres pasos

búsqueda_herramienta
Consulta BM25 contra el nombre, la descripción y los parámetros de la herramienta

descripción_herramienta
Carga el esquema JSON completo para la herramienta coincidente en contexto

llamada_herramienta
El puente se desenvuelve: la herramienta real se ejecuta con barandillas completas

Modelo: tool_search(“crear un problema de github”) → {coincidencias: [{ name: “mcp_github_create_issue” }] } Modelo: tool_describe(“mcp_github_create_issue”) → { parámetros: { tipo: “objeto”, propiedades: {…} } } Modelo: tool_call(“mcp_github_create_issue”, { título: “…” }) → { ok: verdadero, número_edición: 42 }

Resultados de precisión
05 / 07

Las evaluaciones antrópicas de MCP muestran importantes mejoras en la precisión

Los grandes catálogos de herramientas provocan parálisis en las decisiones. Eliminar esquemas irrelevantes del contexto reduce los falsos positivos. Las evaluaciones internas de MCP de Anthropic muestran mejoras significativas en la precisión con la búsqueda de herramientas habilitada.

49% → 74%
Claude Opus 4
precisión en las evaluaciones MCP

79,5% → 88,1%
Claude Opus 4.5
precisión en las evaluaciones MCP

Nota: ~26 puntos porcentuales de precisión siguen siendo errores de recuperación en Opus 4. Los modelos más pequeños funcionan de manera menos confiable en la formulación de consultas. La búsqueda de herramientas supone que el modelo puede escribir una consulta de búsqueda razonable.

Configuración
06 / 07

Configuración de la herramienta de búsqueda en hermes.yaml

herramientas: tool_search: habilitado: auto # auto (predeterminado), activado o desactivado umbral_pct: 10 # % del contexto – solo modo automático search_default_limit: 5 max_search_limit: 20 # Taquigrafía: herramientas: tool_search: true # equivalente a {enabled: auto}

KeyDefaultSignificado habilitadoautoauto se activa por encima del umbral; encendido siempre se activa; off deshabilita el umbral_pct10% de la longitud del contexto en el que se activa el modo automático. Rango: 0—100 search_default_limit5Hits devueltos cuando el modelo llama a tool_search sin límite max_search_limit20Límite superior estricto que el modelo puede solicitar a través del límite. Rango: 1—50

Conclusiones clave
07 / 07

Cuándo usarlo y cuándo no

✓ Más de 15 herramientas adjuntas
✓ Pocas herramientas utilizadas por turno
✓ Múltiples servidores MCP
⚠ Conjuntos de herramientas pequeños: gastos generales netos
⚠ Todas las herramientas utilizadas en cada turno.

Las herramientas de puente cuestan ~300 tokens + al menos un viaje de ida y vuelta adicional por herramienta fría. Los esquemas diferidos no obtienen ningún beneficio de prefijo de caché de solicitud del sistema. El catálogo no tiene estado: se reconstruye en cada turno, evitando errores de deriva. Alcance de seguridad: el puente no puede acceder a herramientas fuera de los conjuntos de herramientas otorgados de la sesión. Las herramientas principales de Hermes (terminal, read_file, web_search, send_message…) nunca se difieren.

Fuente: hermes-agent.nousresearch.com/docs — Blog de ingeniería antrópica — Nous Research 2026

Conclusiones clave

Tool Search pospone los esquemas de herramientas MCP hasta que el modelo realmente los necesita, utilizando un puente tool_search/tool_describe/tool_call. Las evaluaciones de Anthropic muestran mejoras en la precisión del 49 % al 74 % en Claude Opus 4 con grandes catálogos de herramientas. La recuperación de BM25 sobre el nombre de la herramienta + descripción + nombres de parámetros impulsa la búsqueda, con respaldo de subcadena para casos extremos de IDF cero. El modo automático (predeterminado) es autoajustable: se activa solo cuando los esquemas de herramientas superan el 10 % de la ventana de contexto. Las herramientas centrales de Hermes nunca se posponen; solo son elegibles MCP y herramientas de complementos no principales.

Consulte la documentación de búsqueda de la herramienta Hermes Agent y el uso avanzado de la herramienta Anthropic. Además, no dude en seguirnos en Twitter y no olvide unirse a nuestro SubReddit de más de 150.000 ML y suscribirse a nuestro boletín. ¡Esperar! estas en telegrama? Ahora también puedes unirte a nosotros en Telegram.

¿Necesita asociarse con nosotros para promocionar su repositorio de GitHub O su página principal de Hugging O su lanzamiento de producto O seminario web, etc.? Conéctate con nosotros

Herramienta de envíos de agentes Hermes Búsqueda de MCP: las evaluaciones antrópicas muestran una ganancia de precisión del 49% al 74% en Opus 4

ByEquipo de 7 minutos

El problema: las herramientas MCP se están comiendo su ventana contextual

Los números de precisión

Cómo funciona la recuperación: BM25 + Fallback

Referencia de configuración

Explicador visual de Marktechpost

Conclusiones clave

By Equipo de 7 minutos

Related Post

Claude Opus 4.8 ya está disponible en AWS

Liquid AI lanza LFM2.5-8B-A1B: un modelo MoE en el dispositivo con 8,3 mil millones de parámetros activos y 1,5 mil millones en total

Hexo Labs Open-Sources SIA: un agente de mejora automática que actualiza tanto el arnés como los pesos del modelo

You missed

Una nueva herramienta que rastrea cómo el cerebro elimina los desechos podría ofrecer pistas sobre el Alzheimer

ERC y Junts mantienen a Sánchez en el alambre

El creciente coste de encontrar el amor « Euro Weekly News

Stunna Girl rompe su silencio después de un reciente arresto y una foto policial viral