OneEdit: un sistema colaborativo de edición de conocimiento neuronal y simbólico para una integración perfecta y resolución de conflictos en gráficos de conocimiento y modelos de lenguaje de gran tamaño

La inteligencia artificial (IA) se ha centrado durante mucho tiempo en el desarrollo de sistemas que puedan almacenar y gestionar grandes cantidades de información y actualizar ese conocimiento de manera eficiente. Tradicionalmente, se han utilizado sistemas simbólicos como los grafos de conocimiento (KG) para la representación del conocimiento, ofreciendo precisión y claridad. Estos grafos mapean entidades y sus relaciones en una forma estructurada, lo que resulta útil para aplicaciones como el razonamiento, la recuperación de información y el procesamiento del lenguaje natural. Por otro lado, los sistemas neuronales, en particular los modelos de lenguaje grande (LLM), ofrecen un conocimiento expansivo a través del aprendizaje profundo. Los LLM como los modelos GPT y Qwen pueden manejar muchas tareas debido a sus grandes conjuntos de datos y arquitecturas potentes. Sin embargo, el desafío sigue siendo integrar estos dos enfoques para combinar la precisión de los KG con la capacidad expansiva de manejo de datos de los LLM.

Una cuestión clave en la gestión y representación del conocimiento es actualizar el conocimiento de manera eficiente sin tener que volver a entrenar sistemas enteros. Los KG, si bien son precisos, tienen problemas de escalabilidad. Deben mejorar su capacidad para manejar grandes volúmenes de datos, especialmente cuando es necesario integrar nueva información en tiempo real. Por el contrario, los LLM, entrenados en conjuntos de datos extensos, conservan una “instantánea” estática del conocimiento después del entrenamiento. Esto significa que sin volver a entrenarlos, no pueden incorporar nuevos datos. Como resultado, pueden proporcionar información obsoleta o inexacta con el tiempo, especialmente en campos que evolucionan rápidamente, como los asuntos de actualidad o la investigación científica. La incapacidad de actualizar el conocimiento obstaculiza efectivamente el rendimiento de los sistemas de IA, ya que estos sistemas necesitan mantenerse actualizados en entornos dinámicos.

Los métodos anteriores para abordar este problema generalmente se han dividido en tres categorías: metaaprendizaje, localizar y luego editar y técnicas basadas en la memoria. Los modelos de metaaprendizaje utilizan una red externa para predecir los cambios de gradiente necesarios para las actualizaciones de conocimiento, y métodos como MEND y MALMEN son ejemplos notables. Los modelos de localizar y luego editar, como ROME y MEMIT, apuntan a identificar parámetros específicos en el modelo que almacenan el conocimiento requerido, que luego se puede modificar. Los enfoques basados ​​en la memoria como SERAC almacenan estados ocultos específicos en el modelo y los actualizan según sea necesario. A pesar de los avances de estas técnicas, a menudo necesitan ayuda con la manipulación precisa del conocimiento. Estos métodos también introducen efectos secundarios significativos, como el rendimiento degradado del modelo y conflictos entre el conocimiento nuevo y el antiguo.

Los investigadores de la Universidad de Zhejiang, la Universidad Nacional de Singapur y Ant Group han presentado UnoEditar En respuesta a estas limitaciones, este sistema de edición de conocimiento neuronal-simbólico integra KG simbólicos y LLM neuronales. OneEdit es un sistema colaborativo que permite a los usuarios actualizar y gestionar el conocimiento de forma eficaz mediante comandos de lenguaje natural. El sistema está construido sobre un marco modular que consta de tres componentes principales: el Intérprete, el Controlador y el Editor. El Intérprete permite a los usuarios interactuar con el sistema utilizando lenguaje natural, interpretando sus comandos en solicitudes de edición de conocimiento procesables. El Controlador maneja estas solicitudes, utilizando el KG para resolver conflictos entre diferentes piezas de conocimiento, evitando inconsistencias o la introducción de información tóxica o errónea. Finalmente, el Editor ejecuta el proceso de edición, modificando el KG y el LLM en función de la entrada proporcionada.

OneEdit es particularmente eficaz para abordar los conflictos que surgen durante las actualizaciones de conocimiento, un problema común en los sistemas de IA a gran escala. Por ejemplo, al editar el conocimiento, OneEdit garantiza que no solo se actualice el KG, sino que también se mantenga la coherencia en todo el sistema. El sistema también incluye un mecanismo de reversión, que le permite volver a versiones anteriores del conocimiento si surgen errores o conflictos. Esta característica es crucial cuando el conocimiento evoluciona, como en escenarios políticos o avances científicos. El sistema de reversión de OneEdit es eficiente tanto en términos de tiempo como de memoria, lo que permite que el sistema maneje actualizaciones a gran escala sin afectar significativamente el rendimiento.

Los investigadores realizaron experimentos en dos conjuntos de datos para validar el rendimiento de OneEdit: uno centrado en figuras políticas estadounidenses y otro en estadísticas académicas. El sistema se probó con métodos de referencia como ROME, MEMIT, GRACE y el ajuste fino estándar. En cuanto a la confiabilidad, OneEdit demostró una alta precisión, mejorando las métricas de rendimiento con respecto a los enfoques existentes. Por ejemplo, en el conjunto de datos del político estadounidense, OneEdit logró una puntuación de confiabilidad de 0,951 con GRACE y 0,995 con MEMIT, superando a otros métodos que a menudo no lograban mantener la localidad o la precisión en múltiples ediciones. OneEdit también se destacó en escenarios multiusuario, donde el conocimiento fue editado por diferentes usuarios de manera secuencial. En estas pruebas, OneEdit mantuvo la coherencia incluso cuando el mismo fragmento de conocimiento se editó varias veces. Esto es fundamental para aplicaciones del mundo real donde varios usuarios pueden necesitar actualizar los sistemas de IA simultáneamente.

OneEdit también aborda dos tipos de conflictos comunes en los sistemas de conocimiento de IA: conflictos de cobertura y conflictos inversos. Un conflicto de cobertura ocurre cuando dos piezas de conocimiento sobre el mismo tema proporcionan hechos diferentes, como cuando un modelo retiene información contradictoria sobre el presidente de los EE. UU. OneEdit resuelve esto revirtiendo ediciones anteriores antes de aplicar nuevas, lo que garantiza que el sistema siga siendo preciso. OneEdit también maneja los conflictos inversos, donde el modelo no puede inferir la relación inversa del conocimiento.

En conclusión, OneEdit ofrece un enfoque innovador para la edición de conocimiento al combinar las mejores características de los sistemas simbólicos y neuronales. Los investigadores demostraron con éxito que el sistema puede manejar actualizaciones de conocimiento a gran escala de manera eficiente y, al mismo tiempo, minimizar la sobrecarga de memoria y tiempo. Con sus mecanismos de reversión, herramientas de resolución de conflictos y capacidad para operar con múltiples usuarios y conjuntos de datos, OneEdit aborda las limitaciones de los métodos actuales de edición de conocimiento. La capacidad del sistema para mantener la precisión y la confiabilidad en diferentes dominios lo convierte en un avance significativo en la gestión del conocimiento de la IA, con posibles aplicaciones en campos que van desde la política hasta la academia.


Echa un vistazo a la PapelTodo el crédito por esta investigación corresponde a los investigadores de este proyecto. Además, no olvides seguirnos en Gorjeo y únete a nuestro Canal de Telegram y LinkedIn Gr¡Arriba!. Si te gusta nuestro trabajo, te encantará nuestro hoja informativa..

No olvides unirte a nuestro Subreddit con más de 50 000 millones de usuarios

⏩ ⏩ SEMINARIO WEB GRATUITO SOBRE IA: ‘SAM 2 para video: cómo optimizar sus datos’ (miércoles 25 de septiembre, 4:00 a. m. a 4:45 a. m. EST)


Asif Razzaq es el director ejecutivo de Marktechpost Media Inc. Como ingeniero y emprendedor visionario, Asif está comprometido con aprovechar el potencial de la inteligencia artificial para el bien social. Su iniciativa más reciente es el lanzamiento de una plataforma de medios de inteligencia artificial, Marktechpost, que se destaca por su cobertura en profundidad de noticias sobre aprendizaje automático y aprendizaje profundo que es técnicamente sólida y fácilmente comprensible para una amplia audiencia. La plataforma cuenta con más de 2 millones de visitas mensuales, lo que ilustra su popularidad entre el público.