Meta, NYT e mais empresas impedem Apple de treinar IA com seus dados
Por Guilherme Haas |
Uma reportagem da Wired revelou que várias empresas conhecidas no ambiente digital decidiram não permitir que a Apple use seus dados para treinar modelos de inteligência artificial. Entre essas empresas estão gigantes como Meta, The New York Times e Condé Nast, que utilizaram uma ferramenta disponibilizada pela Apple para evitar que seus dados sejam utilizados na construção de modelos de IA.
Bloqueio do Applebot
A Apple, que utiliza o bot Applebot-Extended para coletar dados da web, implementou recentemente um recurso que permite aos proprietários de sites controlarem se suas informações podem ou não ser utilizadas em treinamentos de IA.
O recurso foi disponibilizado há poucos meses e permite que os sites bloqueiem o Applebot-Extended através de um arquivo de configuração conhecido como "robots.txt". Embora o bloqueio não impeça o bot de acessar o site para outros propósitos, como indexação para buscas, ele garante que os dados não sejam usados em modelos de linguagem e outros projetos de IA da Apple.
Entre as empresas que bloquearam o Applebot-Extended, segundo a Wired, estão a Meta (que controla Facebook e Instagram), The New York Times, e Condé Nast (responsável por marcas como Vogue, The New Yorker e Vanity Fair). Outras plataformas incluem Craigslist e Vox Media, que gerencia sites como The Verge e Eater. Além delas, o Financial Times, The Atlantic e a rede USA Today também optaram por restringir o acesso aos seus dados para os treinamentos de IA da Apple.
Veja também: Como os dados na web são coletados para desenvolver IAs
Dados para treinamento de IA
Essa decisão de bloqueio reflete uma crescente preocupação entre empresas de mídia e plataformas online sobre o uso de seus dados para treinamento de IA, especialmente quando se trata de direitos autorais e a possível utilização comercial desses dados sem compensação adequada.
A disputa sobre a coleta de dados por bots de IA não é exclusiva da Apple. Outras grandes empresas, como OpenAI e Google, também enfrentam resistência semelhante, com muitas organizações bloqueando seus bots por motivos semelhantes.
Um exemplo claro desse cenário é o The New York Times, que além de bloquear o Applebot-Extended, está atualmente em litígio com a OpenAI sobre questões de direitos autorais. O jornal expressou preocupações sobre o uso não autorizado de seu conteúdo e ressaltou que o bloqueio de bots é uma medida necessária para proteger os direitos de seus conteúdos publicados.
Apesar do bloqueio por parte de algumas empresas, a maioria dos sites ainda não adotou o Applebot-Extended. Análises recentes indicam que apenas uma pequena porcentagem de sites de alto tráfego bloquearam o bot da Apple, embora o número esteja crescendo gradualmente.
Leia mais sobre o treinamento de modelos de IA:
- Big Techs usaram canais do YouTube para treinar IAs sem permissão
- OpenAI admite que modelos de IA usam materiais protegidos por lei
- Microsoft AI acha que tudo na web é livre e pode ser usado para treinar IA
- O que é o colapso dos modelos de IA, sobre o qual alertam pesquisadores
Fonte: Wired