7 trucos de ingeniería rápidos para mitigar las alucinaciones en los LLM

Introducción

Los modelos de lenguaje grande (LLM) exhiben habilidades sobresalientes para razonar, resumir y generar texto de manera creativa. Aún así, siguen siendo susceptibles al problema común de las alucinaciones, que consiste en generar información aparentemente segura pero falsa, no verificable o, a veces, incluso sin sentido.

Los LLM generan texto basado en intrincados patrones estadísticos y probabilísticos en lugar de depender principalmente de la verificación de verdades fundamentadas. En algunos campos críticos, esta cuestión puede causar importantes impactos negativos. La ingeniería de indicaciones sólida, que implica la habilidad de elaborar indicaciones bien estructuradas con instrucciones, limitaciones y contexto, puede ser una estrategia eficaz para mitigar las alucinaciones.

Las siete técnicas enumeradas en este artículo, con ejemplos de plantillas de mensajes, ilustran cómo tanto los LLM independientes como los sistemas de recuperación de generación aumentada (RAG) pueden mejorar su rendimiento y volverse más robustos contra las alucinaciones simplemente implementándolos en las consultas de los usuarios.

1. Fomentar la abstención y las respuestas de “no sé”

Los LLM generalmente se enfocan en brindar respuestas que parezcan seguras incluso cuando no son seguras; consulte este artículo para comprender en detalle cómo los LLM generan texto, generando como resultado, a veces, hechos inventados. Permitir explícitamente la abstención puede guiar al LLM hacia mitigar una sensación de falsa confianza. Veamos un ejemplo de solicitud para hacer esto:

“Usted es un asistente de verificación de datos. Si no está seguro de una respuesta, responda: ‘No tengo suficiente información para responder eso’. Si está seguro, dé su respuesta con una breve justificación”.

El mensaje anterior iría seguido de una pregunta real o una verificación de hechos.

Un ejemplo de respuesta esperada sería:

“No tengo suficiente información para responder eso”.

“Con base en la evidencia disponible, la respuesta es… (razonamiento)”.

Esta es una buena primera línea de defensa, pero nada impide que un LLM ignore esas instrucciones con cierta regularidad. Veamos qué más podemos hacer.

2. Razonamiento estructurado en cadena de pensamientos

Pedirle a un modelo de lenguaje que aplique un razonamiento paso a paso incentiva la coherencia interna y mitiga las brechas lógicas que a veces podrían causar alucinaciones en el modelo. La estrategia de razonamiento en cadena de pensamiento (CoT) consiste básicamente en emular un algoritmo, como una lista de pasos o etapas que el modelo debe abordar secuencialmente para abordar la tarea general en cuestión. Una vez más, se supone que la plantilla de ejemplo siguiente va acompañada de un mensaje propio específico del problema.

“Por favor, piense en este problema paso a paso:
1) ¿Qué información se da?
2) ¿Qué supuestos se necesitan?
3) ¿Qué conclusión se sigue lógicamente?”