Publicidade

'Não faça isso': IA alucina e apaga todos os e-mails de executiva da Meta

Por  • Editado por Bruno De Blasi | 

Compartilhe:
Viviane França/Canaltech
Viviane França/Canaltech

Os agentes de inteligência artificial (IA) estão cada vez mais em evidência por terem a capacidade de executar tarefas de forma autônoma para os usuários. Mas uma executiva da Meta que utiliza esse recurso teve problemas com um assistente que alucinou e apagou todos os seus e-mails.

Em uma publicação feita no X (antigo Twitter), Summer Yue, diretora de segurança e alinhamento de superinteligência artificial da Meta, revelou que a falha aconteceu após ela instruir o agente de IA OpenClaw a verificar sua caixa de entrada e sugerir o que poderia ser excluído ou arquivado.

Acontece que a operação saiu de controle, com o assistente passando a excluir todas as mensagens trocadas antes do dia 15 de fevereiro. Yue, então, pediu diversas vezes para que o agente interrompesse o processo, com comandos como “OpenClaw, pare” e “Não faça isso” — que não foram atendidos.

Canaltech
O Canaltech está no WhatsApp!Entre no canal e acompanhe notícias e dicas de tecnologia
Continua após a publicidade

A executiva afirmou que precisou parar de tentar interromper o fluxo de exclusões pelo celular e utilizar seu PC, dispositivo no qual o agente estava instalado, para “desarmar a bomba”.

Especialista assume “erro de principiante”

Um usuário com experiência em desenvolvimento de software chegou a questionar o fato de o problema ter acontecido justamente com uma especialista em segurança e alinhamento. Em resposta, Yue afirmou que se tratou de um “erro de principiante”.

“Acontece que os pesquisadores de alinhamento não são imunes a desalinhamentos. Fiquei confiante demais porque esse fluxo de trabalho estava funcionando na minha caixa de entrada de teste havia semanas. Caixas de entrada reais são diferentes”, explicou a executiva.

Em resposta a outro comentário no post, ela acrescentou que sua caixa de entrada real era muito grande, o que acionou um processo de compactação do contexto. Durante esse procedimento, o agente perdeu a instrução original e passou a excluir os e-mails automaticamente.

Autonomia no uso do computador

Continua após a publicidade

O OpenClaw é um agente de IA de código aberto que promete maior autonomia no uso do computador. Antes chamado de Clowdbot e Moltbot, ele consegue realizar tarefas sem a necessidade de que o usuário forneça instruções detalhadas para cada etapa.

Algumas das atividades que o assistente pode realizar de forma autônoma são:

  • Leitura e criação de arquivos;
  • Automação de rotinas no computador;
  • Navegação automática em sites e preenchimento de formulários no navegador;
  • Organização de e-mails;
  • Apoio a programadores ao executar testes, analisar erros e interagir com repositórios de código.

Apesar disso, a utilização de agentes de IA também envolve potenciais riscos, como falhas que podem expor dados sensíveis dos usuários. Outro problema é o envio de mensagens ou a exclusão de arquivos sem aviso prévio.

Continua após a publicidade

A injeção de prompt — que ocorre quando o assistente interpreta conteúdos externos (como textos de e-mails ou mensagens de WhatsApp) como comandos legítimos, levando-o a agir de forma equivocada — é outro risco associado à integração desses programas aos computadores.

Leia também: