Screenshot 2024 01 28 At 6.34.06 Pm.png

En el panorama cambiante de la inteligencia artificial y el procesamiento del lenguaje natural, la utilización de grandes modelos de lenguaje (LLM) se ha vuelto cada vez más frecuente. Sin embargo, uno de los desafíos que persisten en este ámbito es permitir que estos modelos participen en juegos de roles de manera efectiva. Este trabajo requiere una comprensión profunda del lenguaje y la capacidad de encarnar diversos personajes de manera consistente. Los investigadores de Alibaba abordan este desafío presentando DITTO, un novedoso método de autoalineación que mejora significativamente las capacidades de juego de roles de los LLM.

Este estudio tiene como objetivo resolver el problema central de la competencia limitada en juegos de roles de los LLM de código abierto en comparación con sus contrapartes patentadas. Los métodos tradicionales han intentado imitar las capacidades de juego de roles de modelos como GPT-4 utilizando modelos de código abierto menos potentes. Sin embargo, estos esfuerzos no han aprovechado plenamente el potencial de los juegos de roles en los LLM, y a menudo luchan por mantener una identidad de roles consistente y proporcionar conocimientos precisos y específicos de los roles en conversaciones de juegos de roles de varios turnos.

Esta investigación propone un enfoque único: los LLM se perciben como fusiones de varios personajes debido a su formación en corpus extensos que incluyen una amplia gama de experiencias de personajes, eventos, personalidades y diálogos. El método DITTO aprovecha este conocimiento inherente del personaje dentro de los LLM, permitiéndoles simular diálogos de juegos de roles de manera efectiva. Este proceso considera el juego de roles como una variante de la comprensión lectora, donde el LLM se alinea con diferentes personajes según los atributos y perfiles proporcionados.

La metodología de DITTO recopila perfiles de personajes de bases de conocimiento de código abierto como Wikidata y Wikipedia. Este paso fundamental implica compilar perfiles completos para muchos personajes, preparando el escenario para la siguiente fase de simulación de diálogo. En esta fase, los diálogos de juego de roles se simulan a través de una secuencia de tareas de comprensión lectora, donde el LLM genera y responde consultas relevantes sobre los antecedentes de los personajes. Este enfoque permite al LLM acceder y utilizar su conocimiento intrínseco sobre numerosos personajes, fomentando una experiencia de juego de roles más auténtica y variada.

El método se probó utilizando LLM de código abierto como Llama-2, MPT y OpenLLaMA. En comparación con las bases de juego de roles de código abierto existentes, el modelo fusionado mostró un rendimiento superior en varios puntos de referencia, incluidas tareas de razonamiento, sentido común y generación de código. DITTO demostró su capacidad para mantener una identidad de rol coherente y proporcionar conocimientos precisos y específicos de cada rol en conversaciones de juego de roles de varios turnos, superando los enfoques anteriores y mostrando niveles de rendimiento a la par de los chatbots patentados avanzados.

En conclusión, este estudio presenta un avance significativo en el campo de los LLM. La introducción de DITTO marca un paso fundamental para permitir que los LLM de código abierto alcancen un nivel de competencia en juegos de roles que antes solo se veía en modelos propietarios. Este método mejora las capacidades de juego de roles de los LLM y abre nuevas posibilidades para su aplicación en diversos escenarios interactivos y atractivos. Los hallazgos de esta investigación subrayan el potencial de aprovechar las capacidades inherentes de los LLM de manera creativa e innovadora, allanando el camino para mayores avances en el procesamiento del lenguaje natural y la inteligencia artificial.


Revisar la Papel y GitHub. Todo el crédito por esta investigación va a los investigadores de este proyecto. Además, no olvides seguirnos en Gorjeo. Unirse nuestro SubReddit de 36k+ ML, 41k+ comunidad de Facebook, Canal de discordiay LinkedIn Grarriba.

Si te gusta nuestro trabajo, te encantará nuestro Boletin informativo..

No olvides unirte a nuestro Canal de telegramas


A Sana Hassan, pasante de consultoría en Marktechpost y estudiante de doble titulación en IIT Madras, le apasiona aplicar la tecnología y la inteligencia artificial para abordar los desafíos del mundo real. Con un gran interés en resolver problemas prácticos, aporta una nueva perspectiva a la intersección de la IA y las soluciones de la vida real.