Microsoft lanza Agent Lightning: un nuevo marco de inteligencia artificial que permite la capacitación de LLM basada en aprendizaje por refuerzo (RL) para cualquier agente de inteligencia artificial
¿Cómo se convierten los seguimientos de agentes reales en transiciones de RL de aprendizaje por refuerzo para mejorar los LLM de políticas sin cambiar su pila de agentes existente? El…