Uso de herramientas, agentes y el documento Voyager | de Matthew Gunton | mayo, 2024
Históricamente, hemos utilizado modelos de aprendizaje automático de refuerzo con entradas específicas para descubrir estrategias óptimas para maximizar métricas bien definidas (piense en obtener la puntuación más alta en un…