Chip cerebral traduz fala de mulher paralisada em tempo real. Vídeo

Pela primeira vez, uma pessoa com paralisia grave conseguiu “falar” em tempo real usando apenas sinais cerebrais captados por um chip. O feito foi conquistado por pesquisadores das universidades de Berkeley e de San Francisco, ambas nos Estados Unidos, que desenvolveram uma interface cérebro-computador que parece ser capaz de traduzir a atividade neural em palavras e as transforma em voz simultaneamente.

O estudo, publicado na Nature Neuroscience nessa segunda-feira (31/3), supera um desafio mesmo das tecnologias mais modernas: nelas, há uma demora entre a decodificação do pensamento e a produção de som por pessoas com paralisia. A nova técnica permite uma comunicação mais fluida e naturalista do que já havia sido observada anteriormente.

Como os impulsos cerebrais viram voz?

A neuroprótese usada por Ann, paciente que teve sua identidade preservada, capta sinais do córtex motor, região cerebral responsável pelo controle da fala, e os traduz em palavras usando modelos de linguagem: como um ditado, ela repete o que a máquina sugere para treinar o algoritmo.

A equipe treinou o sistema do implante com dados de Ann, que tentava pronunciar frases mentalmente enquanto via prompts em uma tela.

“Interceptamos sinais onde o pensamento deveria virar articulação dos músculos da fala e os interpretamos. Então, o que estamos decodificando é depois que um pensamento aconteceu, depois que decidimos o que dizer, depois que decidimos quais palavras usar e como mover nossos músculos do trato vocal”, explica o neurologista Cheol Jun Cho, um dos coautores do estudo, em comunicado à imprensa.

Para recriar a voz original de Ann, os pesquisadores usaram gravações anteriores à lesão cerebral dela para elaborar os modelos de texto-para-voz. “Assim, o sistema soa mais parecido com ela e permite que ela se identifique”, diz Cho.

Chip com velocidade e precisão sem precedentes

Em testes anteriores, a decodificação levava até oito segundos por frase. Agora, o sistema gera fala audível em menos de um segundo após a intenção de falar.

“Dentro de 1 segundo, temos o primeiro som. E o dispositivo pode decodificar continuamente a fala, então Ann pode continuar falando sem interrupção. Os modelos anteriores demoravam oito segundos e não permitiam isso”, afirma o professor Gopala Anumanchipalli, autor principal do estudo.

A espera reduzida não comprometeu a precisão, mantendo taxas altas de acerto mesmo com palavras novas. Ann relatou que a experiência com a nova técnica foi mais intuitiva. “Ouvir a própria voz em tempo quase real aumentou o senso de corporificação dela, segundo nossas avaliações”, destacou Anumanchipalli. O próximo passo é incorporar variações de tom e emoção, tornando a fala ainda mais expressiva.

Um futuro mais acessível

A tecnologia funciona com diferentes métodos de captação neural, incluindo eletrodos invasivos e sensores não invasivos. O avanço abre caminho para aplicações práticas, como ajudas comunicativas portáteis.

“Isso pode melhorar drasticamente a qualidade de vida de pessoas com paralisia severa”, completa Anumanchipalli. Com ajustes, a técnica pode devolver não apenas palavras, mas a voz única de cada indivíduo — um passo crucial para reintegrar autonomia e conexão humana.

Siga a editoria de Saúde e Ciência no Instagram e no Canal do Whatsapp e fique por dentro de tudo sobre o assunto!

Adicionar aos favoritos o Link permanente.