Publicidade

Wikipédia reorganiza dados para facilitar acesso de IAs às informações

Por  • Editado por Melissa Cruz Cossetti | 

Compartilhe:
Unsplash/Oberon Copeland
Unsplash/Oberon Copeland

A Wikimedia Alemanha anunciou, nesta quarta-feira (1), um novo banco de dados que facilitará o acesso às informações da Wikipédia por parte de modelos de inteligência artificial (IA). O recurso deve permitir que as ferramentas de IA façam um uso mais otimizado das informações da enciclopédia colaborativa online.

Chamado Wikidata Embedding, o sistema é gratuito e converte cada ponto de dados do Wikidata em um vetor — um tipo de coordenada numérica —, permitindo que modelos de linguagem de grande porte (LLMs) usados para treinar IAs realizem buscas mais rápidas e precisas na plataforma.

“Queremos criar uma infraestrutura que permita a todos desenvolver aplicações de IA generativa com base em dados verificáveis, gratuitos e abertos. Este é um passo importante em direção a um mundo digital onde tecnologias em benefício da sociedade não sejam algo secundário, mas sim um padrão”, destacou Lydia Pintscher, líder do portfólio Wikidata na Wikimedia Alemanha.

Canaltech
O Canaltech está no WhatsApp!Entre no canal e acompanhe notícias e dicas de tecnologia
Continua após a publicidade

Wikidata em colaboração com sistemas de IA

O Wikidata é um banco de dados de conhecimento aberto e, embora suas informações sejam legíveis por máquinas, elas foram originalmente projetadas apenas para consultas em linguagem natural e não podiam ser usadas diretamente por sistemas de IA generativa.

No novo projeto, o Wikidata organiza os conteúdos da Wikipédia em vetores que mostram como as informações se relacionam entre si. Com isso, a IA consegue entender o significado de certos termos e processá-los com maior eficácia em linguagem natural.

A tecnologia é combinada com suporte ao Model Context Protocol (MCP), que permite que a IA e o banco de vetores se comuniquem entre si, considerado um passo importante para o desenvolvimento de software livre.

“O lançamento do projeto de incorporação mostra que uma IA poderosa não precisa ser controlada por um punhado de empresas — ela pode ser desenvolvida de forma aberta e colaborativa”, ressaltou Philippe Saadé, gerente de projetos de IA e machine learning na Wikimedia Alemanha.

Recuperação de dados atualizados

O Wikidata Embedding conta com um processo chamado Geração Aumentada de Recuperação (RAG, na sigla em inglês). Esse recurso permite que as IAs recuperem sempre dados atualizados do Wikidata, tornando sua base de conhecimento mais precisa, com resultados mais confiáveis e redução de respostas incorretas.

Continua após a publicidade

Essa facilitação do acesso aos dados da Wikipédia acontece em um momento em que o avanço das IAs atrai cada vez mais buscas que antes eram centralizadas no Google. Portanto, esse é um movimento natural com o intuito de disponibilizar conteúdos de forma mais direta às novas ferramentas tecnológicas.

Leia mais: 

VÍDEO | ChatGPT, Perplexity, Claude, Gemini: qual escolher?

Continua após a publicidade

Fonte: Wikimedia Alemanha