Un grupo de científicos han desarrollado un dispositivo capaz de traducir pensamientos en palabras habladas en tiempo real. Aunque aún es experimental, esperan que la interfaz cerebro-computadora pueda algún día dar voz a quienes no pueden hablar, informa AP.
Un nuevo estudio describe la prueba del dispositivo en una mujer de 47 años con cuadriplejía que no pudo hablar durante 18 años tras sufrir un iderrame cerebral. Los médicos le implantaron el dispositivo en el cerebro durante una cirugía como parte de un ensayo clínico.
"Convierte su intención de hablar en oraciones fluidas", dijo Gopala Anumanchipalli, coautor del estudio publicado el lunes en la revista Nature Neuroscience.
Otras interfaces cerebro-computadora (BCI, por sus siglas en inglés) para el habla suelen tener un ligero retraso entre los pensamientos de las oraciones y su verbalización computarizada. Estos retrasos pueden interrumpir el flujo natural de la conversación, lo que podría generar malentendidos y frustración, según los investigadores.
"Es un avance bastante importante en nuestro campo", señaló Jonathan Brumberg, del Laboratorio de Habla y Neurociencia Aplicada de la Universidad de Kansas, quien no participó en el estudio.
Un equipo en California registró la actividad cerebral de la mujer usando electrodos mientras pronunciaba oraciones en su mente. Los científicos utilizaron un sintetizador que construyeron con su voz antes de la lesión para generar un sonido de habla similar al que ella habría producido. Luego, entrenaron un modelo de inteligencia artificial para traducir la actividad neuronal en unidades de sonido.
Funciona de manera similar a los sistemas existentes que transcriben reuniones o llamadas telefónicas en tiempo real, explicó Anumanchipalli, de la Universidad de California, Berkeley.
El implante se coloca sobre el centro del habla en el cerebro para captar las señales, que luego se traducen en fragmentos de habla que forman oraciones. Es un enfoque "en tiempo real", señaló Anumanchipalli, donde cada fragmento de 80 milisegundos de habla -aproximadamente media sílaba- se envía a un registrador.
"No espera a que se termine una oración", explicó Anumanchipalli. "La procesa sobre la marcha".
Decodificar el habla tan rápido tiene el potencial de mantener el ritmo acelerado del habla natural, dijo Brumberg. Además, el uso de muestras de voz "sería un avance significativo en la naturalidad del habla".
Aunque el trabajo fue financiado en parte por los Institutos Nacionales de Salud (NIH), Anumanchipalli aseguró que no se vio afectado por los recientes recortes en la investigación del NIH. Aún se necesita más investigación antes de que la tecnología esté lista para su uso generalizado, pero con "inversiones sostenidas", podría estar disponible para los pacientes en una década, afirmó.