Sites já podem impedir que o Bard acesse seus conteúdos
Por Guilherme Haas | Editado por Douglas Ciriaco | 29 de Setembro de 2023 às 14h37
O Google lançou na última quinta-feira (28) uma ferramenta de controle que oferece aos administradores de sites a possibilidade de definir se querem ou não ajudar a alimentar e treinar o Bard com seus conteúdos. Dessa forma, páginas da web podem optar por manter suas produções fora dos modelos de inteligência artificial da companhia.
A nova ferramenta para controlar o acesso das IAs se chama Google-Extended e permite que as páginas permaneçam indexadas à busca, mas bloqueiem seus conteúdos para outros produtos.
Esse ajuste pode ser realizado através do robots.txt, um arquivo padrão na estrutura dos sites que dá a permissão para rastreadores robôs analisarem e indexarem as páginas.
O que diz o Google
No comunicado sobre Google-Extended, a Big Tech de Mountain View conta que o recurso é uma resposta à demanda dos publishers que “desejam maior controle sobre como seu conteúdo é usado modelos emergentes de IA generativa.”
A companhia descreve a utilização dos conteúdos dos sites para treinar o Bard ou as APIs do Vertex AI como uma oportunidade de “ajudar esses modelos de IA a se tornarem mais precisos e capazes ao longo do tempo”.
Para o Google, as ferramentas de inteligência artificial oferecem formas “mais fáceis e criativas” para os veículos de comunicação online se conectarem com seu público.
Relação com os veículos
Em julho, a companhia revelou testes com uma IA — chamada Genesis — que promete ajudar jornalistas a escrever notícias. Ela seria capaz de absorver informações sobre acontecimentos recentes e gerar conteúdos noticiosos.
No entanto, a novidade, revelada pelo The New York Times, não foi muito bem recebida por representantes de jornais norte-americanos que acompanharam a demonstração da IA e gerou uma discussão ética sobre o papel do jornalismo e a apropriação dos conteúdos pelos modelos de linguagem das Big Techs.
A criação do Google-Extended é um passo para regulamentar como as IAs podem utilizar as informações publicadas na web, mas ainda há muita discussão a ser feita sobre as implicações legais dessas ferramentas.
O mecanismo de controle lançado pelo Google chega logo após a OpenAI, dona do ChatGPT, lançar um rastreador — o GPTBot — com a opção para os sites bloquearem o acesso do chatbot a seus conteúdos. Veículos como o The New York Times, CNN e Reuters foram os primeiros a bloquear o GPTBot, e outros sites de notícias acompanham essa decisão.