ICMC desenvolve ferramenta inovadora para segmentação de imagens

Publicado em Tecnologia, USP Online Destaque por em

Denise Casatti / Assessoria de Comunicação ICMC
Foto: DivulgaçãoNonato (ao fundo) e Casaca: nova metodologia deve trazer benefícios a diversas áreas
Foto: Divulgação
Nonato (ao fundo) e Casaca: nova metodologia deve trazer benefícios a diversas áreas

Naquela foto memorável da sua família aparece aquela ex-namorada ou ex-namorado que você adoraria eliminar da história da sua vida. E se você pudesse, usando um computador, recortar a figura indesejada, excluindo-a com um simples clique?

Esse tipo de questão não costuma atormentar apenas a vida dos ex-enamorados, sendo relevante também para quem trabalha com a análise de imagens médicas, com a edição de fotografias, com a identificação de indivíduos, de placas de carros entre tantos outros ramos. Contribuir para facilitar a segmentação de uma imagem pode, portanto, ajudar a aprimorar todos esses processos que são realizados diariamente.

Para lidar com esse desafio científico, dois pesquisadores do Instituto de Ciências Matemáticas e de Computação (ICMC) da USP, em São Carlos, uniram-se a um pesquisador da Universidade Brown, nos Estados Unidos. “Conseguimos inovar ao criar uma ferramenta prática e fácil de manusear e implementar”, explica o doutorando Wallace Casaca, do ICMC.

Orientado pelo professor Luis Gustavo Nonato, também do ICMC, o doutorando obteve uma Bolsa Estágio de Pesquisa no Exterior (BEPE) da Fundação de Amparo à Pesquisa do Estado de São Paulo (FAPESP) e passou o ano de 2013 na Universidade Brown, onde trabalhou com o professor Gabriel Taubin.

Wallace explica que a área de segmentação de imagens é uma das mais estudadas em ciências de computação quando o assunto é processamento de imagens e reconhecimento de padrões. Atualmente, existem diversos métodos que possibilitam alterar uma imagem a partir da seleção de algum elemento ali existente que se queira destacar ou excluir. A grande inovação da pesquisa realizada por Wallace, Nonato e Taubin é que eles criaram uma nova metodologia para fazer essa seleção.

Para criar o modelo inovador, os pesquisadores utilizaram uma abordagem matemática, especificamente, as coordenadas de Laplace, que já são usadas para resolver outros problemas computacionais, mas ainda não tinham sido empregadas na segmentação de imagens. A partir desse novo modelo, eles conseguiram criar uma ferramenta – nesse caso, um programa de computador – capaz de segmentar uma imagem de forma fácil e ágil.

Para exemplificar, confira as imagens a seguir. Usando o software criado pelos pesquisadores, é possível informar ao computador que desejamos selecionar – nessa imagem em que aparecem dois monges – apenas o personagem da esquerda, excluindo as demais informações. Nesse caso, primeiramente, é preciso fazer um traço (vermelho) para selecionar a imagem do monge à esquerda e, a seguir, inserir um outro traço envolta da imagem (verde), com o objetivo de informar que desejamos exclui-la do restante da foto. Automaticamente, sem que seja necessário realizar os traços com perfeição, o software reconhece o que precisa ser feito e recorta a figura do monge à esquerda.

Como se faz

portal20140626_2Os traços realizados pelo usuário dão as pistas para que o software seja capaz de reconhecer automaticamente o que é preciso fazer. É como se fossem sementes lançadas para que a ferramenta possa propagá-las até atingir os limites do objeto, por isso, trata-se de um método chamado tecnicamente de segmentação de imagem baseada em sementes. “Ao fazer o traço vermelho, é como se o usuário dissesse para o sistema: coloca essas informações que estão aparecendo aqui na minha imagem. Já com o risco verde, é dada outra dica: só deve aparecer o que está dentro dessa área”, explica Wallace.

Uma das vantagens do novo método é que ele possibilita o recorte de objetos com alta precisão de ajuste nas bordas. Além disso, nos modelos já utilizados, é muito comum que, ao informar ao software que deseja segmentar uma imagem, o usuário se surpreenda com diferentes resultados, mesmo que sejam inseridas as mesmas informações. Na ferramenta criada pela parceira entre o ICMC e a Universidade Brown, esse problema é quase inteiramente cessado. Segundo Wallace, essa vantagem se deve ao modelo matemático empregado.

Para avaliar a nova ferramenta, os pesquisadores a empregaram em 50 imagens disponibilizadas no banco de dados que é comumente usado para esse tipo de pesquisa, o Grabcut, da Microsoft. Os resultados obtidos foram quantitativamente e qualitativamente comparáveis aos métodos que são considerados atualmente o estado da arte.

Repercussão internacional

Foto: Divulgação
Pesquisadores explicam como funciona a nova ferramenta

O primeiro reconhecimento internacional à pesquisa já aconteceu: o artigo mostrando os resultados do trabalho foi selecionado para integrar a categoria full paper da mais importante conferência internacional sobre o assunto, a Conference on Computer Vision and Pattern Recognition (IEEE CVPR), que está acontecendo em Columbus, no Estado de Ohio, nos Estados Unidos, até sábado, 28 de junho. De acordo com os pesquisadores, este ano, 1.807 artigos foram inscritos nessa categoria, mas apenas 29,88% estão entre os selecionados.

Mais informações: 
Link para fazer o download do protótipo da primeira versão da ferramenta:
icmc.usp.br/e/3dbef
Vídeo no Youtube mostrando como a ferramenta funciona:
icmc.usp.br/e/ddf4e

.