Publicidade

Autores processam Anthropic por treinar a IA Claude com livros pirateados

Por  | 

Compartilhe:
Alveni Lisboa/Canaltech
Alveni Lisboa/Canaltech

Três autores iniciaram uma ação coletiva contra a empresa Anthropic alegando o uso não autorizado de suas obras para treinar a IA Claude. A ação foi apresentada em um tribunal federal da Califórnia, nos Estados Unidos, nessa última segunda-feira (19). O processo acusa a Anthropic de ter utilizado versões pirateadas de livros de centenas de autores para alimentar seu modelo de IA.

Dados no “The Pile”

Os autores Andrea Bartz, Charles Graeber e Kirk Wallace Johnson alegam que suas obras foram incluídas em um vasto conjunto de dados, conhecido como "The Pile", que a Anthropic utilizou para treinar sua IA.

Canaltech
O Canaltech está no WhatsApp!Entre no canal e acompanhe notícias e dicas de tecnologia
Continua após a publicidade

Dentro desse conjunto de dados, destaca-se o "Books3", uma biblioteca de ebooks pirateados que inclui obras de diversos autores renomados. A acusação afirma que a Anthropic usou deliberadamente esses materiais, ciente de que eram conteúdos protegidos por direitos autorais.

A Anthropic confirmou que utilizou o "The Pile" para treinar a Claude, mas não comentou diretamente sobre a ação judicial em andamento. A empresa declarou estar ciente do processo e que está avaliando a queixa.

Os autores solicitam que a justiça reconheça a violação de direitos autorais e que a Anthropic seja impedida de continuar utilizando seus trabalhos sem autorização. Além disso, a ação pede compensações financeiras cujo valor ainda não foi especificado.

Questões legais sobre uso de dados

O processo representa mais um capítulo na complicada relação de autores e criadores de conteúdo para o meio digital com as empresas de tecnologia que usam esses materiais para treinar seus modelos de IA.

As empresas do setor utilizam métodos de “raspagem” de dados na internet para coletar grandes volumes de informações, que são essenciais para treinar seus modelos. Embora fundamental para o avanço da IA, essa técnica levanta preocupações legais e éticas, especialmente em relação a direitos autorais e privacidade.

Outros autores e detentores de direitos autorais também têm processado empresas de tecnologia pela raspagem de seus conteúdos na web. Gigantes como OpenAI e Meta enfrentam acusações pelo uso ilegal de materiais protegidos em seus modelos de IA.