Esta investigación de IA de China presenta Character-LLM que enseña a los LLM a actuar como personas específicas como Beethoven, la reina Cleopatra, Julio César, etc.

Character-LLM es un agente entrenable diseñado para simular individuos específicos mediante la edición de perfiles y modelos de entrenamiento como réplicas personales, replicando sus experiencias únicas. Una evaluación en un campo de pruebas implica entrevistar a estos agentes capacitados para evaluar su capacidad para memorizar personajes y experiencias. El enfoque explora la creación de simulacros digitales personalizados, lo que indica un progreso significativo en la simulación de personajes impulsada por IA y la comprensión de las experiencias humanas.

Un equipo de investigadores de China introdujo el concepto de entrenar agentes como simulacros de personajes utilizando Character-LLM. Describe un marco de capacitación que involucra experiencias de reconstrucción, carga y protección de experiencias para entrenar estos simulacros utilizando LLM. Su enfoque enfatiza la edición de perfiles y modelos de entrenamiento para simular figuras históricas específicas como Beethoven, la reina Cleopatra y Julio César. La eficacia se evalúa en un campo de pruebas donde se entrevista a agentes capacitados para evaluar su capacidad para recordar personajes y experiencias. Los resultados experimentales ofrecen ideas para futuros desarrollos en la simulación de personalidades humanas.

Se exploran LLM como ChatGPT y GPT-4 para simular comportamientos humanos en rutinas diarias y experiencias más profundas. Para abordar las limitaciones de las indicaciones simples de LLM, los investigadores presentan Character-LLM. Se trata de un agente entrenable para juegos de roles que aprende de experiencias y emociones reales. Se recopilan experiencias de figuras históricas específicas, como Beethoven, la reina Cleopatra y Julio César, para entrenar personajes-LLM. Su enfoque tiene aplicaciones potenciales en ciencias sociales, desarrollo de NPC y reducción de mano de obra. La evaluación se lleva a cabo a través de un campo de pruebas para evaluar la capacidad de los agentes para recordar personajes y experiencias.

Character-LLM emplea un marco de capacitación que involucra reconstrucción de experiencias, carga y experiencias protectoras, enfocándose en formalizar experiencias de personajes como Beethoven, la reina Cleopatra y Julio César. Los agentes son entrenados utilizando grandes modelos de lenguaje para crear simulacros personales con perfiles y estados emocionales editados. La evaluación se lleva a cabo mediante entrevistas en un patio de pruebas para evaluar la memorización de los personajes. Si bien proporciona información valiosa, su estudio necesita más detalles técnicos sobre los métodos de capacitación y la implementación del marco.

Los Character-LLM demuestran un rendimiento superior en personalidad, memorización, alucinaciones y estabilidad en comparación con los modelos de referencia. A pesar de su menor escala, los Character-LLM logran un rendimiento comparable al de la base de LLM a gran escala, ChatGPT. Sus agentes entrenables producen respuestas más vívidas, recuerdan experiencias pasadas específicas y rechazan preguntas antinaturales. La longitud de la respuesta influye en los resultados, favoreciendo un texto más corto y natural. Sin embargo, la reflexión sobre los valores del carácter sigue siendo un desafío. Los hallazgos experimentales ofrecen información valiosa para avanzar en el desarrollo de simulacros humanos.

En conclusión, Character-LLM es un agente entrenable eficaz para simular individuos específicos, mostrando un rendimiento impresionante en personalidad, memorización, alucinaciones y estabilidad. Los Character-LLM se comparan favorablemente con la poderosa línea base ChatGPT, incluso en una escala más pequeña. Estos agentes ofrecen respuestas vívidas, recuerdan experiencias específicas y rechazan preguntas antinaturales. Los hallazgos proporcionan información valiosa para avanzar en el desarrollo de simulacros humanos. El trabajo futuro se centra en crear agentes aún más capaces de interactuar con personas reales, ejercer mayor poder y fomentar conexiones humanas sólidas.


Revisar la Papel. Todo el crédito por esta investigación va a los investigadores de este proyecto. Además, no olvides unirte. nuestro SubReddit de 32k+ ML, Comunidad de Facebook de más de 40.000 personas, Canal de discordia, y Boletín electrónicodonde compartimos las últimas noticias sobre investigaciones de IA, interesantes proyectos de IA y más.

Si te gusta nuestro trabajo, te encantará nuestra newsletter.

También estamos en WhatsApp. Únase a nuestro canal de IA en Whatsapp.


Hola, mi nombre es Adnan Hassan. Soy pasante de consultoría en Marktechpost y pronto seré aprendiz de gestión en American Express. Actualmente estoy cursando una doble titulación en el Instituto Indio de Tecnología, Kharagpur. Me apasiona la tecnología y quiero crear nuevos productos que marquen la diferencia.