NVIDIA AI presenta ProRL Agent: una infraestructura de implementación como servicio desacoplada para el aprendizaje reforzado de agentes LLM de múltiples turnos a escala
Los investigadores de NVIDIA presentaron ProRL AGENT, una infraestructura escalable diseñada para la capacitación en aprendizaje por refuerzo (RL) de agentes LLM de múltiples turnos. Al adoptar una filosofía de…