ISSN 2359-5191

10/12/2015 - Ano: 48 - Edição Nº: 127 - Ciência e Tecnologia - Instituto de Matemática e Estatística
IME cria ferramenta de conversão em línguas diferentes
Pesquisa do grupo de Computação Musical do instituto elabora sistema para processamento de voz

Desenvolver um sistema que transforme sentenças arbitrárias pronunciadas por um locutor origem A, de modo que o resultado da transformação soe como se fossem pronunciadas por um locutor destino B é o principal objetivo da pesquisa de Anderson Fraiha, do Instituto de Matemática e Estatística (IME) da USP. Como os locutores A e B são falantes de línguas diferentes, a conversão é dita interlinguística.

O interesse pelo tema, como diz Anderson, surgiu pensando nas dublagens do cinema: "O tema nasceu de um vislumbre cinematográfico. Seria bom ouvir a voz de um respectivo ator no nosso próprio idioma". A partir disso, várias aplicações são possíveis, como multimídia, entretenimento e até mesmo restauração digital, área mais circunscrita da medicina. Ao longo da trajetória da pesquisa, muitas ideias foram aparecendo: "Diversos outros objetivos secundários, como por exemplo o desenvolvimento de ferramentas para uso geral em processamento de voz, como mapas fonéticos artificiais, métodos  de transformações de espectros sonoros baseados em distorção em frequência, ou mesmo métodos para estimativas de envoltórias espectrais, utilizadas em transmissão e compactação de sinais de áudio."

A pesquisa, entretanto, não era de fácil execução. Como diz Fraiha: "O projeto era longo e bastante ambicioso, o que exigiu que se adotasse a estratégia clássica de divisão e conquista". Assim, o sistema foi subdividido em cinco módulos, e em cada um deles foi necessário um estudo bibliográfico minucioso. Procurou-se entender, dentro do tema processamento de fala, a representação, a análise e síntese dos sinais de voz, a parametrização dos sinais acústicos e o mapeamento e a transformação desses sinais. "Traçada a meta, procurei me aperfeiçoar, buscando e absorvendo técnicas e conceitos fundamentais para a realização da pesquisa", diz o Anderson.

Por se tratar de um projeto interdisciplinar, Anderson relata dificuldade na sua efetuação: "O conhecimento fica diluído entre mundos e pensamentos totalmente diferentes", afirma. O estudo teve participação de engenheiros e cientistas, o que conferiu uma boa experiência para Fraiha. "Mas isso não deixou de ser bem difícil, pois as visões são opostas em muitos aspectos." Além disso, foi difícil adquirir material fonográfico adaptado ao português, forçando o pesquisador a utilizar amostras em espanhol e inglês

Os resultados da pesquisa, na prática, são amplos. "Pode-se dizer que os resultados hoje são até mais úteis para o processamento de áudio em geral do que para conversão de voz especificamente". Vários pesquisadores de outros países chegaram a procurar Anderson, no esforço por implementações e informações sobre o projeto. Outras pesquisas, inciadas a partir de Fraiha, empenham-se em estudar mais profundamente a transcrição fonética. "Há até uma empresa na Polônia desenvolvendo um software para dublagem fidedigna de filmes com base no sistema apresentado", remetendo, curiosamente, ao surgimento da ideia inicial.

Além disso, cotidianamente, existem aplicações em entretenimento, como por exemplo, karaokê personalizado, aplicativos educativos com vozes de pessoas famosas, e até mesmo, como diz Anderson, "aplicações na área médica que busca reconstrução de vozes de pessoas que foram gradativamente perdendo-a devido a algum tipo de patologia". No entanto, como outros métodos foram sendo elaborados ao longo da pesquisa, qualquer um deles é potencialmente útil para realização de tarefas específicas em processamento de áudio e voz.


Leia também...
Agência Universitária de Notícias

ISSN 2359-5191

Universidade de São Paulo
Vice-Reitor: Vahan Agopyan
Escola de Comunicações e Artes
Departamento de Jornalismo e Editoração
Chefe Suplente: Ciro Marcondes Filho
Professores Responsáveis
Repórteres
Alunos do curso de Jornalismo da ECA/USP
Editora de Conteúdo
Web Designer
Contato: aun@usp.br