Desbloquear la respuesta del lenguaje del cerebro: cómo los modelos GPT predicen e influyen en la actividad neuronal

Los avances recientes en técnicas de aprendizaje automático e inteligencia artificial (ML) se utilizan en todos los campos. Estos sistemas avanzados de IA han sido posibles gracias a los avances en la potencia informática, el acceso a grandes cantidades de datos y las mejoras en las técnicas de aprendizaje automático. Los LLM, que requieren enormes cantidades de datos, generan un lenguaje similar al humano para muchas aplicaciones.

Un nuevo estudio realizado por investigadores del MIT y la Universidad de Harvard ha desarrollado nuevos conocimientos para predecir cómo responde el cerebro humano al lenguaje. Los investigadores enfatizaron que este puede ser el primer modelo de IA que impulse y suprima respuestas de manera efectiva en la red del lenguaje humano. El procesamiento del lenguaje involucra redes del lenguaje, específicamente áreas del cerebro principalmente en el hemisferio izquierdo. Incluyen partes de los lóbulos frontal y temporal del cerebro. Se han realizado investigaciones para comprender cómo funciona esta red, pero aún queda mucho por saber sobre los mecanismos subyacentes implicados en la comprensión del lenguaje.

A través de este estudio, los investigadores intentaron evaluar la eficacia de los LLM para predecir las respuestas cerebrales a diversas entradas lingüísticas. Además, su objetivo es comprender mejor las características de los estímulos que impulsan o suprimen respuestas dentro del área de la red lingüística de los humanos. Los investigadores formularon un modelo de codificación basado en un LLM estilo GPT para predecir las reacciones del cerebro humano a oraciones arbitrarias presentadas a los participantes. Construyeron este modelo de codificación utilizando incrustaciones de oraciones de último token de GPT2-XL. Se entrenó en un conjunto de datos de 1.000 oraciones diversas extraídas de corpus de cinco participantes. Finalmente, probaron el modelo en oraciones retenidas para evaluar sus capacidades predictivas. Concluyeron que el modelo alcanzó un coeficiente de correlación de r=0,38.

Para evaluar más a fondo la solidez del modelo, los investigadores realizaron varias otras pruebas utilizando métodos alternativos para obtener incrustaciones de oraciones e incorporar incrustaciones de otra arquitectura LLM. Descubrieron que el modelo mantenía un alto rendimiento predictivo en estas pruebas. Además, descubrieron que el modelo de codificación era preciso para el rendimiento predictivo cuando se aplicaba a regiones del lenguaje anatómicamente definidas.

Los investigadores enfatizaron que este estudio y sus hallazgos tienen implicaciones sustanciales para la investigación de la neurociencia fundamental y las aplicaciones del mundo real. Observaron que la manipulación de las respuestas neuronales en la red del lenguaje puede abrir nuevos campos para estudiar el procesamiento del lenguaje y potencialmente tratar los trastornos que afectan la función del lenguaje. Además, la implementación de LLM como modelos de procesamiento del lenguaje humano puede mejorar las tecnologías de procesamiento del lenguaje natural, como los asistentes virtuales y los chatbots.

En conclusión, este estudio es un paso importante para comprender la conexión y la similitud de funcionamiento entre la IA y el cerebro humano. Los investigadores utilizan los LLM para desentrañar los misterios que rodean el procesamiento del lenguaje y desarrollar estrategias innovadoras para influir en la actividad neuronal. Los investigadores esperan ver descubrimientos más interesantes en este dominio a medida que la IA y el aprendizaje automático evolucionen.


Revisar la Papel. Todo el crédito por esta investigación va a los investigadores de este proyecto. Además, no olvides seguirnos en Gorjeo y noticias de Google. Unirse nuestro SubReddit de 36k+ ML, 41k+ comunidad de Facebook, Canal de discordiay LinkedIn Grarriba.

Si te gusta nuestro trabajo, te encantará nuestro Boletin informativo..

No olvides unirte a nuestro Canal de telegramas


Rachit Ranjan es pasante de consultoría en MarktechPost. Actualmente está cursando su B.Tech en el Instituto Indio de Tecnología (IIT) de Patna. Está dando forma activamente a su carrera en el campo de la inteligencia artificial y la ciencia de datos y le apasiona y se dedica a explorar estos campos.