¿Pueden los datos benignos socavar la seguridad de la IA? Este artículo de la Universidad de Princeton explora la paradoja del ajuste del aprendizaje automático
El ajuste de la seguridad es importante para garantizar que los modelos de lenguaje grande (LLM) avanzados estén alineados con los valores humanos y sean seguros de implementar. Los LLM…