Criar ferramentas que contribuam para resolver três problemas que afetam a humanidade: o diagnóstico de demências, o combate à dengue e a tradução e classificação automática de textos. Uma das maiores empresas de tecnologia do mundo, o Google, acaba de reconhecer o potencial e a relevância de três projetos com esses objetivos, que nasceram no Instituto de Ciências Matemáticas e de Computação (ICMC) da USP, em São Carlos, a cerca de 240 quilômetros da capital paulista.
Os projetos concorreram com outras centenas de propostas no programa Bolsas de Pesquisa Google para a América Latina. Das 12 iniciativas selecionadas, o que representa menos de 5% do total de projetos inscritos, oito são brasileiros, sendo quatro da USP. Desses quatro, três pertencem ao ICMC e serão realizados por doutorandos que receberão do Google, durante pelo menos um ano, uma bolsa mensal de US$ 1,2 mil. Seus orientadores também serão contemplados com uma bolsa de US$ 750.
“Estamos vivendo uma época em que todos os dias somos surpreendidos por avanços tecnológicos incríveis. Saúde, meio ambiente, planejamento urbano: nada está fora do alcance da inovação tecnológica. Os projetos da USP São Carlos vencedores do Bolsas de Pesquisa Google para a América Latina mostram o papel crucial da pesquisa para ajudar a resolver problemas reais das nossas vidas”, diz Berthier Ribeiro-Neto, diretor de Engenharia do Google para a América Latina.
O desafio do doutorando Leandro dos Santos é contribuir para o diagnóstico precoce de demências. A professora Sandra Aluísio irá apoiá-lo na jornada. Já a meta do estudante de doutorado André Maletzke é ajudar no combate à dengue, contando com a orientação do professor Gustavo Batista. Encerrando o trio de projetos contemplados, o doutorando Edilson Corrêa Júnior trabalhará na criação de um novo método que promete aprimorar as técnicas empregadas atualmente para tradução e classificação automática de textos. Como no universo da web os textos são fundamentais, tal método também tem potencial para melhorar os resultados dos mecanismos de busca empregados, por exemplo, pelo próprio Google. Corrêa Júnior será orientado pelo professor Diego Amancio.
Foco nas demências
Mesmo que você não conheça ninguém com Alzheimer, já deve ter ouvido falar nessa doença. A má notícia é que, com o aumento da expectativa de vida da população, a tendência é que, a cada dia, mais e mais pessoas sejam acometidas pelo Alzheimer ou por outros tipos de síndrome menos conhecidos como o Comprometimento Cognitivo Leve (CCL). “Quando um paciente é diagnosticado com CCL, ainda é possível reverter a situação. Mas se nenhum tratamento for realizado, existe uma alta taxa de conversão para Alzheimer”, explica Sandra Aluísio.
Diagnosticar essas doenças é um desafio que os profissionais da área médica enfrentam diariamente em todo o mundo. Para isso, eles costumam realizar uma bateria de exames com os pacientes visando identificar as áreas mais afetadas, tais como memória, orientação, linguagem e resolução de problemas.
É muito comum, durante esses testes, que o avaliador relate uma história para o paciente, que precisará recontá-la logo depois de ouvi-la e contá-la novamente após um período maior de tempo. A principal dificuldade, nesse caso, é que essa tarefa é aplicada manualmente e depende da avaliação subjetiva de quem relatou a história. “Criar um método computacional que automatize essa avaliação é muito bem-vindo para possibilitar a ampla utilização do teste e uniformizar a avaliação”, ressalta a professora.
Ela explica que o projeto será realizado em colaboração com pesquisadores da Faculdade de Medicina da USP e que a meta é criar um avaliador neuropsicológico pessoal automatizado e acessível via web ou a partir de dispositivos móveis. Com esse avaliador será possível detectar os primeiros sinais de CCL. “A ideia não é substituir psicólogos nem fonoaudiólogos, mas criar uma ferramenta da área de Processamento de Línguas Naturais que os auxilie no diagnóstico das demências”, destaca Sandra, que é pesquisadora do Núcleo Interinstitucional de Linguística Computacional (NILC), sediado no ICMC.
Foco na dengue
A dengue é a principal doença viral transmitida por mosquitos e um dos principais problemas de saúde pública enfrentado no Brasil e em quase todos os países localizados em áreas tropicais e subtropicais do mundo. Atualmente, devido à falta de uma vacina efetiva contra a dengue, as epidemias somente podem ser evitadas com o controle do mosquito vetor, o Aedes aegypti.
“A verdade é que estamos perdendo a guerra contra a dengue”, afirma o professor Gustavo Batista, que faz parte do Laboratório de Inteligência Computacional do ICMC. Ele explica que, para realizar as ações de controle do mosquito, os órgãos que combatem a doença levam em conta dados referentes aos pacientes diagnosticados com dengue. Mas como esses dados demoram certo tempo para serem gerados, eles não são indicadores eficazes para mostrar onde, de fato, os mosquitos estão e onde deve ser o foco das ações de combate.
Esse desafio mobiliza o professor Gustavo Batista há cerca de quatro anos. Seus esforços já resultaram na criação de um sensor capaz de identificar, com uma acurácia de 96,1%, as espécies e o sexo dos insetos. Isso é muito importante no caso da dengue, em que apenas as fêmeas são vetores da doença. “Nossa meta, agora, é transformar esse sensor em um produto eletrônico: uma armadilha inteligente que possa ser comercializada”, diz Batista.
De acordo com o professor, quem possuir a armadilha em casa poderá realizar a contagem dos mosquitos em tempo real e tomar providências para o combate ao Aedes, antes da ocorrência de surtos da dengue. Também é viável conectar o equipamento à internet, possibilitando que os dados obtidos pelas armadilhas gerem mapas de controle para os órgãos públicos. Além disso, é possível criar aplicativos que poderão alertar a população sobre a presença do mosquito.
Com o apoio do Google, a pesquisa prosseguirá com a realização de testes fora do laboratório, onde não há controle em relação à temperatura, umidade e demais condições ambientais, nem sobre as espécies de insetos que poderão adentrar a armadilha. Depois dos testes, é preciso desenvolver um protótipo do equipamento. A estimativa é de que seu custo para os consumidores não ultrapasse R$ 200,00.
Foco nos textos
Faça um simples teste e você verá o quanto é preciso aprimorar os mecanismos que usamos hoje para traduzir e classificar automaticamente textos. Neste exemplo, vamos usar os versos finais do poema Noturno à janela do apartamento, de Carlos Drummond de Andrade: “A soma da vida é nula. Mas a vida tem tal poder: na escuridão absoluta, como líquido, circula”. Use um tradutor automático e passe os versos para o chinês. Depois, converta-os novamente para o português. Provavelmente, você chegará a um resultado próximo a isso: “A soma de vida é zero. Mas há uma força na vida: na escuridão absoluta, tal como a circulação de líquido”.
Um leitor atento logo verá que os inúmeros sentidos presentes no verso original de Drummond se perderam durante o processo de tradução automática. “Uma das principais causas desse tipo de alteração de sentido é a ambiguidade presente nos textos, uma das questões que mais afetam os mecanismos de tradução automática”, explica o professor Diego Amancio.
Chamamos de ambíguo, de forma geral, aquilo que pode ter mais do que um sentido ou significado. O poema usado como exemplo propicia várias interpretações e, por isso, a ambiguidade está ali presente tal como na maioria dos textos. Acontece que o computador não tem a habilidade que nós temos para realizar essa tarefa adequadamente e levar em conta essas inúmeras possibilidades de interpretação.
Atualmente, para ensinar uma máquina a interpretar um texto, os pesquisadores empregam técnicas de aprendizado de máquina. Para deduzir o significado de um termo, levam-se em consideração as palavras vizinhas. Voltando ao exemplo de Drummond, “líquido” é vizinho de “circula”. Como o computador já traduziu muitas vezes essas duas palavras, ele “aprendeu” que, normalmente, as pessoas escrevem “circulação de líquido”.
“Nossa meta é criar uma estratégia complementar que não leve em conta somente as palavras vizinhas, mas também os diferentes significados que um termo pode ter e a estrutura do texto”, revela Amancio. A fim de chegar a melhores resultados, os pesquisadores usam o computador para transformar os textos em redes complexas”.
Na imagem, em vez de enxergarmos um texto, observamos uma rede com vértices repletos de bolinhas coloridas (P1, P2, P3…): cada uma representa uma palavra e as diferentes cores (laranja e azul) indicam que essa palavra tem dois significados. Já os fios mostram como os termos se conectam uns com os outros. “Analisando essas redes, podemos compreender melhor como os sentidos das palavras se distribuem e descobrir maneiras de medir as relações entre elas”, completa o professor, que também faz parte do Núcleo Interinstitucional de Linguística Computacional.
Segundo ele, a pesquisa poderá gerar resultados relevantes para aprimorar as ferramentas automáticas de tradução e classificação de textos, recuperar informações em páginas da web e melhorar as ferramentas de buscas que usamos hoje em dia. Se a pesquisa obtiver os resultados esperados, é provável que, em um futuro não muito distante, o próprio Google possa empregar a nova metodologia.
Denise Casatti / Assessoria de Comunicação do ICMC
Mais informações: (16) 3373-9666, site http://googlebrasilblog.blogspot.com.br/