ToolHop: un nuevo conjunto de datos diseñado para evaluar LLM en escenarios de uso de herramientas de múltiples saltos
Las consultas de múltiples saltos siempre han causado dificultades a los agentes de LLM con sus soluciones, ya que requieren múltiples pasos de razonamiento e información de diferentes fuentes. Son…