Los modelos de lenguaje grandes (LLM) han ganado una atención significativa por su capacidad de almacenar grandes cantidades de conocimiento factual dentro de sus pesos durante el preentrenamiento. Esta capacidad ha llevado a resultados prometedores en tareas intensivas en conocimiento, particularmente en la respuesta a preguntas factuales. Sin embargo, persiste un desafío crítico: los LLM a menudo generan respuestas plausibles pero incorrectas a las consultas, lo que socava su confiabilidad. Esta inconsistencia en la precisión factual plantea un obstáculo significativo en la adopción generalizada y la confianza de los LLM para aplicaciones basadas en el conocimiento. Los investigadores están lidiando con el desafío de mejorar la factualidad de los resultados de los LLM al tiempo que mantienen su versatilidad y capacidades generativas. El problema se complica aún más por la observación de que incluso cuando los LLM poseen la información correcta, aún pueden producir respuestas inexactas, lo que sugiere problemas subyacentes en la recuperación y aplicación del conocimiento.
Los investigadores han intentado diversos enfoques para mejorar la facticidad en los LLM. Algunos estudios se centran en el impacto de los ejemplos desconocidos durante el ajuste fino, revelando que estos pueden empeorar potencialmente la facticidad debido al sobreajuste. Otros enfoques examinan la fiabilidad del conocimiento factual, mostrando que los LLM a menudo tienen un rendimiento inferior al esperado en información oscura. Las técnicas para mejorar la facticidad incluyen la manipulación de los mecanismos de atención, el uso de sondas internas no supervisadas y el desarrollo de métodos para que los LLM se abstengan de responder preguntas inciertas. Algunos investigadores han introducido técnicas de ajuste fino para alentar a los LLM a rechazar preguntas fuera de sus límites de conocimiento. Además, los estudios han investigado los mecanismos de los LLM y la dinámica de entrenamiento, examinando cómo se almacenan y extraen los hechos, y analizando la dinámica previa al entrenamiento de la adquisición de sintaxis y los patrones de atención. A pesar de estos esfuerzos, persisten los desafíos para lograr una precisión factual constante.
En este estudio, investigadores del Departamento de Aprendizaje Automático de la Universidad Carnegie Mellon y del Departamento de Ciencias de la Computación de la Universidad de Stanford descubrieron que el impacto de los ejemplos de ajuste fino en los LLM depende críticamente de qué tan bien se codifiquen los hechos en el modelo entrenado previamente. El ajuste fino de los hechos bien codificados mejora significativamente la facticidad, mientras que el uso de hechos menos bien codificados puede perjudicar el rendimiento. Este fenómeno se produce porque los LLM pueden utilizar conocimientos memorizados o confiar en “atajos” generales para responder preguntas. La composición de los datos de ajuste fino determina qué mecanismo se amplifica. Los hechos bien conocidos refuerzan el uso de conocimientos memorizados, mientras que los hechos menos familiares fomentan el uso de atajos. Esta perspectiva proporciona una nueva perspectiva para mejorar la facticidad de los LLM mediante la selección estratégica de datos de ajuste fino.
El método utiliza una configuración sintética para estudiar el impacto del ajuste fino de los datos en la factualidad de LLM. Esta configuración simula un espacio de tokens simplificado para sujetos, relaciones y respuestas, con un formato diferente entre las tareas previas al entrenamiento y las posteriores. Las muestras previas al entrenamiento se extraen de una distribución Zipf para sujetos y una distribución uniforme para relaciones. Los hallazgos clave revelan que el ajuste fino de los hechos populares mejora significativamente la factualidad, con efectos amplificados para las entidades menos populares. El estudio examina la influencia del parámetro de distribución Zipf y los pasos previos al entrenamiento en este fenómeno. Estas observaciones conducen al concepto de “prominencia de hechos”, que representa qué tan bien un modelo conoce un hecho, lo que influye en el comportamiento de ajuste fino y el rendimiento posterior. Este enfoque sintético permite una investigación controlada de los procesos previos al entrenamiento que serían poco prácticos con modelos de lenguaje grandes reales.
Los resultados experimentales en múltiples conjuntos de datos (PopQA, Entity-Questions y MMLU) y modelos (Llama-7B y Mistral) muestran de manera consistente que el ajuste fino en ejemplos menos populares o menos confiables tiene un rendimiento inferior al uso de conocimiento popular. Esta brecha de rendimiento se amplía para los puntos de prueba menos populares, lo que respalda la hipótesis de que los hechos menos populares son más sensibles a las opciones de ajuste fino. Sorprendentemente, incluso los subconjuntos seleccionados al azar superan el ajuste fino en el conocimiento menos popular, lo que sugiere que incluir algunos hechos populares puede mitigar el impacto negativo de los menos populares. Además, el entrenamiento en un subconjunto más pequeño de los hechos más populares a menudo tiene un rendimiento comparable o mejor que el uso de todo el conjunto de datos. Estos hallazgos indican que la selección cuidadosa de los datos de ajuste fino, centrándose en hechos bien conocidos, puede conducir a una mayor precisión fáctica en los LLM, lo que potencialmente permite procesos de entrenamiento más eficientes y efectivos.
El estudio proporciona información importante para mejorar la veracidad de los modelos lingüísticos mediante la composición estratégica de conjuntos de datos de control de calidad. Contrariamente a las suposiciones intuitivas, el ajuste fino de los hechos conocidos mejora de manera consistente la veracidad general. Este hallazgo, observado en diversos entornos y respaldado por un modelo conceptual, desafía los enfoques convencionales para el diseño de conjuntos de datos de control de calidad. La investigación abre nuevas vías para mejorar el rendimiento de los modelos lingüísticos, lo que sugiere posibles beneficios en las técnicas de regularización para superar el desequilibrio de la atención, las estrategias de aprendizaje curricular y el desarrollo de datos sintéticos para una extracción eficiente del conocimiento. Estos hallazgos proporcionan una base para el trabajo futuro destinado a mejorar la precisión y la fiabilidad fácticas de los modelos lingüísticos en diversas aplicaciones.
Revisar la Papel. Todo el crédito por esta investigación corresponde a los investigadores de este proyecto. Además, no olvides seguirnos en Gorjeo.
Únete a nuestro Canal de Telegram y LinkedIn Gr¡Arriba!.
Si te gusta nuestro trabajo, te encantará nuestro Boletin informativo..
No olvides unirte a nuestro Subreddit de más de 46 000 millones de usuarios
Asjad es consultor en prácticas en Marktechpost. Está cursando la licenciatura en ingeniería mecánica en el Instituto Indio de Tecnología de Kharagpur. Asjad es un entusiasta del aprendizaje automático y del aprendizaje profundo que siempre está investigando las aplicaciones del aprendizaje automático en el ámbito de la atención médica.