Pesquisadores usam IA para interpretar textos antigos jamais compreendidos

Por Alveni Lisboa • Editado por Douglas Ciriaco | 05/08/2021 às 16:18

Compartilhe:

Pesquisadores da Universidade de Notre Dame, na França, criaram uma inteligência artificial capaz de ler caligrafias de línguas antigas e provavelmente já mortas. A ideia é usar uma rede neural artificial para ofertar uma “percepção humana” à máquina e assim possibilitar a capacidade de transcrição precisa.

Hoje, os museologistas e estudiosos da área costumam fotografar essas peças para perpetuar o conteúdo e tentar descobrir o que ele significa. Com a técnica aplicada, os integrantes do Departamento de Ciência da Computação e Engenharia da instituição querem automatizar a transcrição de modo similar aos olhos e mentes humanos, o que forneceria uma leitura rápida e compreensível do texto.

O Canaltech está no WhatsApp!Entre no canal e acompanhe notícias e dicas de tecnologia

Continua após a publicidade

No material publicado na revista científica Transactions on Pattern Analysis and Machine Intelligence, do Institute of Electrical and Electronics Engineers (IEEE), os cientistas explicam que foi criada uma metodologia para medir as conexões entre estímulos físicos e mentais. A ideia é adicionar comportamentos humanos à máquina para que o resultado seja algo muito próximo da inteligência humana.

Para isso, foram consideradas questões como quanto tempo um leitor experiente levaria para reconhecer aquele caractere específico ou o que significa certas abreviações. As respostas para esses tipos de dúvidas exigem muito conhecimento técnico de quem analisa o material. O desafio é transpor essa bagagem toda da cabeça de homens e mulheres estudiosos para os chips e transistores.

Criação da IA de leitura

Para dar o primeiro passo, a equipe estudou manuscritos latinos digitalizados que foram redigidos por escribas no Mosteiro de St. Gall, no século IX. Cada especialista inseriu suas transcrições manuais em uma interface de software criada especialmente para essa finalidade. Foi mensurado o tempo de reação a partir da leitura, a compreensão das palavras e a transcrição, de fato, solicitando do leitor a avaliação se as passagens eram fáceis ou difíceis de transpor.

Esse experimento proporcionou uma leitura mais precisa e realista, muito mais próxima do comportamento humano — essa técnica é chamada medição psicofísica. É uma estratégia bem diferente do que se usa em aprendizagem de máquina normalmente, na qual se parte de uma imensa base de dados e se busca a otimização completa dos procedimentos com o auxílio do processamento absurdo de um supercomputador.

Um dos avanços mais notáveis da pesquisa foi a transcrição de textos etíopes, com a adaptação para um idioma com um conjunto de caracteres completamente diferente. As línguas mais arcaicas não usavam o alfabeto como o nosso e isso era um imenso empecilho para qualquer “programa de tradução” comum.

Por que é tão difícil ler manuscritos?

Tem uma diferença grande entre tirar uma foto e expô-la e ter um software capaz de transformar uma mera visualização em algo compreensível, pesquisável. A maioria dos textos antigos são de muito antes da invenção da imprensa, por isso a caligrafia era algo constante e difícil de ler. Existe uma série de fatos históricos e outras questões que influenciam no tipo de escrita, por isso os pesquisadores acreditam haver muitos fatos ainda não decifrados, coisas que a máquina pode ajudar.

Continua após a publicidade

Para entender isso melhor, basta associar com os dias atuais: imagine um pesquisador, daqui a 300 anos, tentando entender o que significa retuíte, cringe, shipar e outras terminologias da moda. Se a internet mundial der pane e todo conhecimento documentado se perder, a pessoa lá no futuro teria que estudar a realidade deste período para entender esse tipo de fala.

O próximo passo é afinar ainda mais a IA para desenvolver transcrições mais precisas, especialmente no caso de documentos danificados, manchados ou incompletos. Os cientistas querem também adicionar um recurso que consiga compreender ilustrações e outros elementos da página, que hoje deixam o software confuso. O fato é que muitos relatos históricos ainda podem ser descobertos caso a tecnologia avance.

Fonte: Universidade de Notre Dame, IEEE