'Não faça isso': IA alucina e apaga todos os e-mails de executiva da Meta
Por João Melo • Editado por Bruno De Blasi |

Os agentes de inteligência artificial (IA) estão cada vez mais em evidência por terem a capacidade de executar tarefas de forma autônoma para os usuários. Mas uma executiva da Meta que utiliza esse recurso teve problemas com um assistente que alucinou e apagou todos os seus e-mails.
- Qual é a diferença entre IA generativa e agentes de IA?
- Adeus, protótipos: por que a IA em 2026 será a era dos 'agentes de execução'
Em uma publicação feita no X (antigo Twitter), Summer Yue, diretora de segurança e alinhamento de superinteligência artificial da Meta, revelou que a falha aconteceu após ela instruir o agente de IA OpenClaw a verificar sua caixa de entrada e sugerir o que poderia ser excluído ou arquivado.
Acontece que a operação saiu de controle, com o assistente passando a excluir todas as mensagens trocadas antes do dia 15 de fevereiro. Yue, então, pediu diversas vezes para que o agente interrompesse o processo, com comandos como “OpenClaw, pare” e “Não faça isso” — que não foram atendidos.
A executiva afirmou que precisou parar de tentar interromper o fluxo de exclusões pelo celular e utilizar seu PC, dispositivo no qual o agente estava instalado, para “desarmar a bomba”.
Especialista assume “erro de principiante”
Um usuário com experiência em desenvolvimento de software chegou a questionar o fato de o problema ter acontecido justamente com uma especialista em segurança e alinhamento. Em resposta, Yue afirmou que se tratou de um “erro de principiante”.
“Acontece que os pesquisadores de alinhamento não são imunes a desalinhamentos. Fiquei confiante demais porque esse fluxo de trabalho estava funcionando na minha caixa de entrada de teste havia semanas. Caixas de entrada reais são diferentes”, explicou a executiva.
Em resposta a outro comentário no post, ela acrescentou que sua caixa de entrada real era muito grande, o que acionou um processo de compactação do contexto. Durante esse procedimento, o agente perdeu a instrução original e passou a excluir os e-mails automaticamente.
Autonomia no uso do computador
O OpenClaw é um agente de IA de código aberto que promete maior autonomia no uso do computador. Antes chamado de Clowdbot e Moltbot, ele consegue realizar tarefas sem a necessidade de que o usuário forneça instruções detalhadas para cada etapa.
Algumas das atividades que o assistente pode realizar de forma autônoma são:
- Leitura e criação de arquivos;
- Automação de rotinas no computador;
- Navegação automática em sites e preenchimento de formulários no navegador;
- Organização de e-mails;
- Apoio a programadores ao executar testes, analisar erros e interagir com repositórios de código.
Apesar disso, a utilização de agentes de IA também envolve potenciais riscos, como falhas que podem expor dados sensíveis dos usuários. Outro problema é o envio de mensagens ou a exclusão de arquivos sem aviso prévio.
A injeção de prompt — que ocorre quando o assistente interpreta conteúdos externos (como textos de e-mails ou mensagens de WhatsApp) como comandos legítimos, levando-o a agir de forma equivocada — é outro risco associado à integração desses programas aos computadores.
Leia também: