Una IA puede decodificar grabaciones de ondas cerebrales para predecir las palabras que alguien está leyendo
Vértigo3d/Getty Images
Utilizando únicamente un casco lleno de sensores combinado con inteligencia artificial, un equipo de científicos ha anunciado que pueden convertir los pensamientos de una persona en palabras escritas.
En el estudio, los participantes leyeron pasajes de texto mientras usaban una gorra que registraba la actividad eléctrica del cerebro a través de su cuero cabelludo. Estas grabaciones de electroencefalograma (EEG) luego se convirtieron en texto utilizando un modelo de inteligencia artificial llamado DeWave.
Chin Teng Lin de la Universidad Tecnológica de Sydney (UTS), Australia, afirma que la tecnología no es invasiva, relativamente barata y fácilmente transportable.
Si bien el sistema está lejos de ser perfecto, con una precisión de aproximadamente el 40 por ciento, Lin dice que los datos más recientes que actualmente están siendo revisados por pares muestran una precisión mejorada que supera el 60 por ciento.
En el estudio presentado en el Conferencia NeurIPS En Nueva Orleans, Luisiana, los participantes leyeron las frases en voz alta, aunque el programa DeWave no utiliza palabras habladas. Sin embargo, en la última investigación del equipo, los participantes leyeron las frases en silencio.
El año pasado, un equipo liderado por Jerry Tang en la Universidad de Texas en Austin informó una precisión similar al convertir pensamientos en texto, pero se utilizaron resonancias magnéticas para interpretar la actividad cerebral. El uso de EEG es más práctico, ya que los sujetos no tienen que permanecer quietos dentro de un escáner.
El modelo DeWave se entrenó observando muchos ejemplos en los que las señales cerebrales coinciden con oraciones específicas, dice el miembro del equipo Charles Zhou de la UTS.
“Por ejemplo, cuando piensas en decir ‘hola’, tu cerebro envía ciertas señales”, dice Zhou. “DeWave aprende cómo estas señales se relacionan con la palabra ‘hola’ al ver muchos ejemplos de estas señales para diferentes palabras u oraciones”.
Una vez que DeWave entendió bien las señales del cerebro, el equipo las conectó a un modelo de lenguaje grande (LLM) de código abierto, similar a la IA que impulsa ChatGPT.
“Este LLM es como un escritor inteligente que puede formar oraciones. Le decimos a este escritor que preste atención a las señales de DeWave y las utilice como guía para crear oraciones”, dice Zhou.
Finalmente, el equipo entrenó juntos tanto a DeWave como al modelo de lenguaje para mejorar aún más la escritura de oraciones basadas en los datos del EEG.
Con un mayor perfeccionamiento, los investigadores predicen que el sistema podría revolucionar la comunicación de las personas que han perdido el habla, como las afectadas por un derrame cerebral, y también podría tener aplicaciones en robótica.
Craig Jin en la Universidad de Sydney dice que está impresionado con el trabajo del equipo de Lin. “Es un progreso excelente”, dice.
“La gente ha querido convertir el EEG en texto durante mucho tiempo y el modelo del equipo está mostrando una notable exactitud. Hace varios años, las conversiones de EEG a texto eran una completa y absoluta tontería”.
Temas: