Prime Intellect lanza prime-rl 0.6.0 para entrenar modelos MoE de billones de parámetros en cargas de trabajo Agentic RL
Prime Intellect ha lanzado la versión 0.6.0 de Prime-rl. El marco apunta al aprendizaje reforzado en modelos de combinación de expertos (MoE) de billones de parámetros. Se centra en cargas…