Conozca Harness-1: un subagente de recuperación 20B capacitado con aprendizaje por refuerzo dentro de un arnés de búsqueda con estado en gpt-oss-20b
La mayoría de los agentes de búsqueda están capacitados como políticas sobre una transcripción cada vez mayor. El modelo decide cómo buscar. También debe recordar lo que vio, qué pruebas…