ProgressGym: un marco de aprendizaje automático para la alineación ética dinámica en sistemas de inteligencia artificial de vanguardia
Los sistemas de IA de vanguardia, incluidos los LLM, moldean cada vez más las creencias y los valores humanos al actuar como asistentes personales, educadores y autores. Estos sistemas, entrenados…