Facilitar a separação e classificação de clientes em uma loja ou de pacientes diagnosticados com uma doença em uma clínica médica ou um hospital. Essas são algumas das possíveis aplicações para as técnicas de agrupamento de dados desenvolvidas por Thiago Covões durante seu doutorado no Instituto de Ciências Matemáticas e de Computação (ICMC) da USP, em São Carlos.
Financiado pela Fundação de Amparo à Pesquisa do Estado de São Paulo (FAPESP), o trabalho Algoritmos evolutivos para modelos de mistura de gaussianas em problemas com e sem restrições recebeu o prêmio de melhor tese de doutorado no Concurso de Teses e Dissertações do 12º Congresso Brasileiro de Inteligência Computacional, realizado de 13 a 16 de outubro, em Curitiba. Atualmente, Covões está realizando pós-doutorado na USP, em Ribeirão Preto, também na área de inteligência computacional.
Possíveis aplicações
No caso de uma grande loja, um desafio comum a ser enfrentado é a identificação automática de grupos em milhares de clientes baseando-se, por exemplo, em suas informações sociodemográficas. Com tantos registros e novos cadastros sendo gerados a todo instante, o processo de agrupamento pode se tornar computacionalmente complexo e quase impossível de ser realizado. Uma das vantagens das técnicas criadas por Covões é possibilitar a classificação online desses dados: “Trabalhando de forma online, o computador passa a processar localmente um conjunto menor de dados e o consumo de memória da máquina é menor”.
As técnicas desenvolvidas por Covões envolvem algoritmos – sequências de comandos passadas para um computador a fim de definir uma tarefa. Nesse caso, foram utilizados algoritmos evolutivos, que possuem como característica particular analisarem, simultaneamente, mais de uma solução para um determinado problema. “Essa foi a maior dificuldade durante a pesquisa, pois os algoritmos evolutivos geralmente são muito custosos computacionalmente. Na tese, consegui mostrar que é possível desenvolvê-los de forma que sejam competitivos com outros algoritmos que costumam ser usados para o problema”, revela o pesquisador.
Uma das vantagens das técnicas criadas na pesquisa é possibilitar que um usuário forneça informações ao sistema antes de realizar a separação dos dados, por meio de restrições. Dessa forma, uma das técnicas pode, por exemplo, auxiliar a identificação de subdivisões em pacientes diagnosticados com câncer ou algum outro tipo de doença. Segundo o pesquisador, essas mesmas técnicas podem ser aplicadas em outras esferas como no processamento de imagens ou no reconhecimento de voz.
No doutorado, Covões foi orientado pelo professor Eduardo Hruschka, do ICMC: “O professor foi fundamental no trabalho, acompanhou tudo de perto. Nós discutíamos os algoritmos em detalhes e conversávamos bastante sobre cada etapa do trabalho”. Além disso, o professor também orientou Covões em seu mestrado no ICMC e durante sua iniciação científica, realizada na Universidade Católica de Santos (UNISANTOS), onde o estudante se graduou em Ciências de Computação.
Da Assessoria de Comunicação do ICMC
Mais informações: (16) 3373.9666, email comunica@icmc.usp.br