Reforzamiento de la curiosidad Aprendizaje de la retroalimentación humana CD-RLHF: un marco de IA que mitiga la compensación de alineación de diversidad en los modelos de idiomas
Los modelos de idiomas grandes (LLM) se han vuelto cada vez más dependientes del aprendizaje de refuerzo de la retroalimentación humana (RLHF) para ajustar en diversas aplicaciones, incluida la generación…