Google propone Tumix: escala de tiempo de prueba de múltiples agentes con mezcla de uso de herramientas
¿Qué pasaría si, en lugar de volver a muestrear a un agente, podría llevar a Gemini-2.5 Pro al 34.1% en HLE mezclando 12-15 agentes de uso de herramientas que comparten…