Casi dos décadas después de sufrir un derrame cerebral del tronco encefálico a la edad de 30 años que la dejó incapaz de hablar, una mujer en los Estados Unidos recuperó la capacidad de convertir sus pensamientos en palabras en tiempo real gracias a un nuevo proceso de interfaz cerebral (BCI).
Al analizar su actividad cerebral en incrementos de 80 milisegundos y traducirla en una versión sintetizada de su voz, el método innovador de los investigadores estadounidenses disipó un retraso frustrante que plagó versiones anteriores de la tecnología.
La capacidad de nuestro cuerpo para comunicar sonidos tal como creemos que es una función que a menudo damos por sentado. Solo en raros momentos cuando nos vemos obligados a hacer una pausa para un traductor, o escuchar nuestro discurso retrasado a través de un orador, apreciamos la velocidad de nuestra propia anatomía.
Para personas cuya capacidad de dar forma al sonido ha sido separada de su Centros de habla del cerebroya sea a través de condiciones como esclerosis lateral amiotrófica o lesiones en crítica Partes del sistema nerviosoLos implantes cerebrales junto con el software especializado han prometido una nueva oportunidad de vida.
Un número de Proyectos de traducción del habla BCI BCI han visto avances monumentales Recientemente, cada uno con el objetivo de alejarse en el momento tomado para generar el discurso de los pensamientos.
La mayoría de los métodos existentes requieren una porción completa de texto que se considere antes de que el software pueda descifrar su significado, lo que puede arrastrar significativamente los segundos entre el inicio del habla y la vocalización.
Esto no solo no es natural, sino que también puede ser frustrante e incómodo para quienes usan el sistema.
“Mejorar la latencia de la síntesis del habla y la velocidad de decodificación es esencial para la conversación dinámica y la comunicación fluida”, los investigadores de la Universidad de California en Berkeley y San Francisco Escribir en su informe publicado.
Esto se “compuesta por el hecho de que la síntesis del habla requiere tiempo adicional para reproducir y para que el usuario y el oyente comprendan el audio sintetizado”, explica El equipo, dirigido por la Universidad de California, el ingeniero informático de Berkeley, Kaylo Littlejohn.
Además, la mayoría de los métodos existentes se basan en que el ‘orador’ entrene la interfaz al pasar abiertamente por los movimientos de vocalización. Para las personas que están fuera de práctica, o siempre han tenido dificultades para hablar, proporcionar su software de decodificación con suficientes datos podría ser un desafío.
Para superar ambos obstáculos, los investigadores capacitaron a una red neuronal flexible y de aprendizaje profundo en la actividad de la corteza sensoriomotora del participante de 47 años, mientras que ella ‘hablaba’ en 100 oraciones únicas de un vocabulario de poco más de 1,000 palabras.
Littlejohn y sus colegas también utilizaron una forma asistida de comunicación basada en 50 frases utilizando un conjunto más pequeño de palabras.
A diferencia de los métodos anteriores, este proceso no involucró al participante que intentaba vocalizar, solo para pensar que las oraciones en su mente.
La decodificación del sistema de ambos métodos de comunicación fue significativa, con el número promedio de palabras por minuto traducido cerca del doble de los métodos anteriores.
Es importante destacar que el uso de un método predictivo que podría interpretar continuamente sobre la mosca permitió que el discurso del participante fluyera de una manera mucho más natural que era 8 veces más rápido que otros métodos. Incluso sonaba como su propia voz, gracias a un programa de síntesis de voz basado en grabaciones previas de su discurso.
Al ejecutar el proceso fuera de línea sin limitaciones a tiempo, el equipo mostró que su estrategia podría incluso interpretar señales neuronales que representan palabras en las que no había sido entrenado deliberadamente.
Los autores señalan que todavía hay mucho margen de mejora antes de que el método pueda considerarse clínicamente viable. Aunque el discurso era inteligible, no alcanzó los métodos que decodifican el texto.
En vista de Hasta dónde la tecnología ha llegado En solo unos añosSin embargo, hay razones para ser optimistas de que aquellos sin voz pronto podrían estar cantando las alabanzas de los investigadores y sus dispositivos de lectura mental.
Esta investigación fue publicada en Neurociencia de la naturaleza.