Enseñar modelos a expresar su incertidumbre con palabras.

Mostramos que un modelo GPT-3 puede aprender a expresar la incertidumbre sobre sus propias respuestas en lenguaje natural, sin el uso de logits del modelo. Cuando se le plantea una pregunta, el modelo genera tanto una respuesta como un nivel de confianza (por ejemplo, “90% de confianza” o “alta confianza”). Estos niveles se corresponden con probabilidades que están bien calibradas. El modelo también permanece moderadamente calibrado bajo cambios de distribución y es sensible a la incertidumbre en sus propias respuestas, en lugar de imitar ejemplos humanos. Hasta donde sabemos, esta es la primera vez que se ha demostrado que un modelo expresa incertidumbre calibrada sobre sus propias respuestas en lenguaje natural. Para probar la calibración, presentamos el conjunto de tareas CalibratedMath. Comparamos la calibración de la incertidumbre expresada en palabras (“probabilidad verbalizada”) con la incertidumbre extraída de los modelos logits. Ambos tipos de incertidumbre son capaces de generalizar la calibración bajo un cambio de distribución. También proporcionamos evidencia de que la capacidad de GPT-3 para generalizar la calibración depende de representaciones latentes previamente entrenadas que se correlacionan con la incertidumbre epistémica sobre sus respuestas.

Enseñar modelos a expresar su incertidumbre con palabras.

ByEquipo de 7 minutos

By Equipo de 7 minutos

Related Post

Mend.io lanza un marco de gobernanza de seguridad de IA que cubre el inventario de activos, la clasificación de riesgos, la seguridad de la cadena de suministro de IA y el modelo de madurez

Simulé una cadena de suministro internacional y dejé que OpenClaw la monitoreara

Una implementación detallada en Equinox con módulos nativos JAX, transformaciones filtradas, capas con estado y flujos de trabajo de capacitación de un extremo a otro

You missed

Parece poco probable que los legisladores respalden los recortes de 16.000 millones de dólares de RFK al HHS

Orihuela se acerca a la Zona de Bajas Emisiones – El Líder

Recordando al legendario cineasta Satyajit Ray en el aniversario de su muerte

¿Qué pasará cuando nuestro sol comience a morir? Estos ‘arqueólogos estelares’ pueden haber encontrado una pista