Screenshot 2023 09 14 At 6.42.58 Pm.png

Los grandes modelos de lenguaje (LLM) han ocupado un lugar central en un mundo donde la tecnología avanza a pasos agigantados. Estos LLM son programas informáticos increíblemente sofisticados que pueden comprender, generar e interactuar con un lenguaje humano de una manera notablemente natural. En una investigación reciente, se ha dado a conocer un innovador agente conversacional encarnado conocido como FurChat. Los LLM como GPT-3.5 han superado los límites de lo que es posible en el procesamiento del lenguaje natural. Pueden comprender el contexto, responder preguntas e incluso generar texto que parece escrito por un ser humano normal. Esta poderosa capacidad ha abierto puertas a innumerables oportunidades en diversos ámbitos como la robótica.

Investigadores de la Universidad Heriot-Watt y Alana AI proponen FurChat, un sistema revolucionario que puede funcionar como recepcionista, realizar conversiones dinámicas y transmitir emociones a través de expresiones faciales. El despliegue de Furchat en el Robotarium Nacional ejemplifica su potencial transformador, facilitando conversaciones naturales con los visitantes y ofreciendo información diversa sobre instalaciones, noticias, investigaciones y próximos eventos.

El robot Furhat, un busto robótico humanoide, tiene una máscara tridimensional que se parece mucho a un rostro humano y emplea un microproyector para proyectar una expresión facial animada sobre esta máscara. El robot está montado sobre una plataforma monitoreada que permite que su cabeza se mueva y asienta, mejorando sus interacciones realistas. Para facilitar la comunicación, Furhat está equipado con un conjunto de micrófonos y parlantes, lo que le permite reconocer y responder al habla humana.

Su sistema está diseñado para aplicaciones perfectas. Dialogue Management implica tres componentes principales: NLU, DM y una base de datos personalizada. NLU analiza el texto entrante, clasifica las intenciones y evalúa la confianza. DM mantiene el flujo conversacional, envía indicaciones a LLM y procesa respuestas. Se crea una base de datos personalizada raspando el sitio web de Nation Robotarium, que proporciona datos relevantes para las intenciones del usuario. La ingeniería rápida garantiza respuestas naturales de LLM. Combina algunas técnicas de aprendizaje rápido y de aprendizaje rápido para generar respuestas conscientes del contexto. El análisis de gestos aprovecha los gestos faciales de Furhat SDK y el reconocimiento de sentimientos de LLM a partir de texto para sincronizar las expresiones faciales con el habla, creando una interacción inmersiva. Amazon Polly se utiliza para la conversión de texto a voz, que está disponible en FurhatOS.

En el futuro, los investigadores se están preparando para ampliar sus capacidades. Su objetivo es permitir interacciones multiusuario, un área de investigación activa en el campo de los robots recepcionistas. Además, para abordar el problema que plantean las alucinaciones en los modelos de lenguaje, planean explorar estrategias como ajustar el modelo de lenguaje y experimentar con la generación de conversación directa, reduciendo la dependencia de los componentes NLU. Un hito importante para los investigadores es la demostración de FurChat en la conferencia Sigdial. Servirá como plataforma para demostrar las capacidades del sistema a una audiencia más amplia de pares y expertos.


Revisar la Papel. Todo el crédito por esta investigación va a los investigadores de este proyecto. Además, no olvides unirte. nuestro SubReddit de más de 30.000 ml, Comunidad de Facebook de más de 40.000 personas, Canal de discordia, y Boletín electrónicodonde compartimos las últimas noticias sobre investigaciones de IA, interesantes proyectos de IA y más.

Si te gusta nuestro trabajo, te encantará nuestra newsletter.


Astha Kumari es pasante de consultoría en MarktechPost. Actualmente está cursando un curso de doble titulación en el departamento de ingeniería química del Instituto Indio de Tecnología (IIT), Kharagpur. Es una entusiasta del aprendizaje automático y la inteligencia artificial. Está interesada en explorar sus aplicaciones en la vida real en diversos campos.