Pesquisadores do IFSC participam de estudo que usa a física estatística para desvendar manuscrito antigo

Publicado em Ciências por em

Da Assessoria de Comunicação do IFSC

Técnicas de física estatística ajudam a desvendar os segredos do Manuscrito de Voynich, texto supostamente escrito antes do século 15 e descoberto em 1912. A pesquisa de físicos brasileiros, que teve a participação de cientistas do Instituto de Física de São Carlos (IFSC) da USP, revela que os textos do Voynich não são um conjunto de palavras aleatórias e sem significado e de signos sem sentido, mas um livro que pode trazer valiosas informações, ao que tudo indica, sobre ervas e astrologia, uma vez que as ilustrações encontradas na obra são de imagens de plantas e corpos celestes. A contribuição da física veio com o uso de conceitos de redes complexas e séries temporais, além de estatísticas sobre as palavras no texto.

“Com a análise de ‘séries temporais’ foi possível verificar a intermitência do uso de palavras no texto, ou seja, qual o padrão de repetição de uma mesma palavra ao longo do manuscrito”, explica Osvaldo Novais de Oliveira Junior, professor do IFSC que participou do estudo. “Em outras obras literárias, conseguir identificar esse padrão de intervalos pode dar dicas sobre um autor ou sobre o assunto de um texto”. Também integraram o grupo de pesquisadores o professor Luciano da Fontoura Costa e o doutorando do IFSC, Diego Amancio. As conclusões do estudo foram publicadas em artigo da revista PLOS One.

Para entender a aplicação de séries temporais na análise de textos, imagine que um livro tenha como tema ciências exatas e que seus primeiros capítulos versem sobre física e os últimos sobre matemática. No começo, é provável que a palavra “relatividade” apareça com frequência, o que não ocorrerá nos capítulos finais, nos quais a palavra “geometria analítica”, por exemplo, aparecerá mais vezes. Para a análise de grande quantidade de dados, como num livro, emprega-se um computador, que tem a desvantagem de não fazer uma análise tão detalhada como um humano pode. “Por outro lado, num computador, a velocidade de processamento é muito mais rápida e a quantidade de dados que pode ser analisada é consideravelmente maior”, explica o professor.

Outra abordagem importante para investigar o manuscrito de Voynich foi a de redes complexas, em que um texto é representado por uma rede na qual os nós são as palavras e se estabelecem conexões quando duas palavras aparecerem juntas. Se houver muitas ocorrências dessas palavras, aumenta-se o peso da conexão. “Das características da rede, de sua topologia, pode-se extrair informações importantes. Dentre essas características, estão quais palavras são mais conectadas, se há formação de aglomerados de palavras em comunidades, e qual é a distribuição de conexões entre as palavras no texto”, elucida Oliveira Junior.

Nova informação

Para ter certeza de que o texto do Voynich não se tratava de um texto de palavras ao acaso, os físicos o compararam com textos reais em várias línguas, e identificaram parâmetros das redes que permitem distinguir um texto aleatório de um texto real. “Fizemos redes com textos reais de 15 idiomas e utilizamos mais de 20 métricas para verificar quais distinguiam um texto aleatório de um texto real. Dessa forma, conseguimos verificar que o Voynich não é um texto aleatório. Pretendíamos também identificar a qual idioma o Voynich é mais similar, mas a quantidade de dados de que dispúnhamos não foi suficiente para obter conclusões estatisticamente significativas. Infelizmente não há muitos textos traduzidos em diversas línguas que estejam disponíveis na internet”, conta o professor.

Para identificar as palavras-chave do Voynich, os físicos verificaram nas métricas de rede e séries temporais quais palavras se sobressaiam. E para comprovar a razoabilidade da estratégia, foram utilizadas as mesmas táticas para textos de idiomas conhecidos. “Utilizamos estratégias de controle, para saber se aquela metodologia era eficiente. No nosso caso, comparamos textos do Novo Testamento em 15 idiomas para identificar palavras-chave. Como a estratégia deu certo, ela também foi utilizada para detectar as palavras-chave do Voynich”, afirma Oliveira Junior.

Das análises no artigo e a partir de estudos recentes de outros pesquisadores, conclui-se que, por não se tratar de um texto aleatório, provavelmente o Voynich tenha sido escrito num idioma desconhecido, artificial. Mais importante ainda é que as estratégias utilizadas pelos pesquisadores funcionaram bem, o que poderá dar pistas importantes aos futuros (e corajosos) “decifradores” do manuscrito.

O professor comenta que, embora a análise do misterioso Voynich tenha sido um dos alvos principais da pesquisa, as abordagens de física estatística e física computacional desenvolvidas podem ser úteis para muitas outras aplicações. O conhecimento gerado pode auxiliar na análise de grandes volumes de dados, inclusive de textos. “Hoje, a maneira como uma máquina aprende é muito rudimentar, requerendo intensa participação de humanos. No futuro, será possível que o computador tome decisões de como aprender e fazer aquisições dessas informações, transformando-as em conhecimento, inclusive para ele próprio”, afirma.

.