EESC cria classificador automático que agrupa músicas por gênero

Método utiliza informações do sinal de áudio e pode ser aplicado também em diversas áreas.

João Ortega/ Agência USP de Notícias

Um estudo realizado na Escola de Engenharia de São Carlos (EESC) da USP criou um classificador automático de músicas em gêneros musicais, que utiliza como parâmetros diferentes informações dos sinais de áudio. “Algo importante desse trabalho é que ele não explora informação musical como notas e ritmo, como ocorre em outros trabalhos da área”, analisa o engenheiro Antonio José Homsi Goulart, realizador da pesquisa. Classificadores musicais em gênero normalmente são utilizados em programas e sites de músicas para organizar as obras,  gerar playlists e dar sugestões baseadas no gosto do ouvinte.

O classificador, em sua configuração final, conseguiu diferenciar eficientemente músicas de estilos similares brasileiros: os gêneros utilizados foram samba, bossa-nova, axé e forró. Apesar de já existirem outros classificadores importantes de gêneros musicais, este, por utilizar outros parâmetros, é um adicional para contribuir na eficiência dessa função.

Além disso, o modelo de análise dos sinais desse trabalho pode ser aplicado em diversas áreas. Qualquer tipo de emissão de ondas pode ser estudada baseada nesse método. Na medicina, por exemplo, é possível utilizá-lo para verificar o som emitido por órgãos e diagnosticar algum sintoma dessa maneira. Uma das ferramentas utilizada, a wavelet, que decompõe o sinal em faixas e analisa-o de forma mais detalhada, apresentando resultados mais precisos, foi criada para estudo de ondas sísmicas da movimentação de placas tectônicas.

Áudio

O estudo, intitulado Classificação automática de gênero musical baseada em entropia e fractais, é a dissertação de mestrado do engenheiro e foi orientado em parceria pelos professores Carlos Dias Maciel, da EESC e Rodrigo Capobianco Guid, da Universidade Estadual Paulista (Unesp) em São José do Rio Preto, que já realizaram vários trabalhos na área da análise de sinais. Guido vem orientando trabalhos com aplicação no som da voz que, por meio do estudo da entropia (dinâmica das ondas de áudio) baseada em wavelet, podem detectar nódulos na garganta de uma pessoa.

Goulart, no início de seu estudo, tentou utilizar este mesmo sistema para aplicação nos sinais musicais. Entretanto, as ferramentas do trabalho do orientador não foram eficazes para a música. Dessa forma, foi aplicado no classificador um conceito de entropia diferente do clássico, que se mostrou mais eficiente. Além disso, outros parâmetros foram adicionados para análise: a dimensão de fractal, ou seja, o espaço que um sinal ocupa, e a lacunaridade, que é a heterogeneidade de um sinal. A dimensão fractal não trouxe melhoras ao sistema, mas a lacunaridade ajudou, pois ela trata da distribuição dos padrões da informação, e, portanto, pode verificar similaridades e diferenças nos estilos musicais.

Além dos parâmetros, Goulart teve de escolher o melhor tipo de programa para o classificador, entre os já existentes para essa função. Eles são treinados com os parâmetros e então criam uma estatística, em que uma música será classificada baseada nas chances de que seja classificada sobre determinado estilo. Por exemplo: analisando a entropia e a lacunaridade, atribui-se uma chance de 80% de a música ser uma bossa-nova e 10% de que seja um samba. A resposta do classificador é que tal música é uma bossa.

Em primeiro lugar, o sistema escolhido foi o Support Vectors Machine (SVM), cujo princípio é a seleção de um vetor que divide da melhor forma possível aquilo que é de um estilo daquilo que é de outro. Ele se mostrou eficiente no teste entre três gêneros musicais bem distintos: blues, lounge e música clássica.

O pesquisador então procurou dificultar o trabalho do programa: “Aumentei o número de estilos e deixei eles mais próximos entre si”. Utilizando os gêneros samba, bossa-nova, axé e forró, o sistema, desta vez, não teve êxito. Assim, foi escolhido um novo tipo de classificador: o Gaussian Mixture Models (GMM), sistema que trabalha com a análise das Curvas de Gauss, frequentemente utilizadas no estudo de ondas. Ele se mostrou muito eficiente, mesmo com os gêneros numerosos e similares.

Mais informações: email ag@ime.usp.br, com o pesquisador Antonio José Homsi Goulart

Scroll to top