Claude já escreve 80% do código da Anthropic e assusta a empresa
Por Marcelo Fischer Salvatico |

Em maio de 2026, mais de 80% do código integrado à base de produção da Anthropic foi escrito pelo Claude, segundo relatório publicado pelo Anthropic Institute na última quarta-feira (4).
- Haiku, Sonnet e Opus: quais as diferenças entre os modelos do Claude?
- Tudo sobre o Claude: conheça os modelos e recursos da IA da Anthropic
O número subiu de dígitos simples desde o lançamento do Claude Code, em fevereiro de 2025, e é acompanhado de um alerta da própria empresa: o ritmo de evolução pode levar a sistemas que projetam seus próprios sucessores sem controle humano adequado.
O documento, intitulado "When AI builds itself" (Quando a IA se constrói, em inglês), foi produzido por Marina Favaro e Jack Clark, do Anthropic Institute. Segundo os autores, o fenômeno descrito como "autoaperfeiçoamento recursivo" ainda não foi atingido, mas pode chegar antes do que as instituições esperam.
Os números por trás da mudança
A produtividade dos funcionários da Anthropic multiplicou de forma expressiva. No segundo trimestre de 2026, engenheiros entregaram oito vezes mais código por trimestre do que entre 2021 e 2025. Em uma pesquisa interna com 130 pesquisadores, a mediana das respostas apontou uma produção quatro vezes maior ao usar o modelo mais recente da empresa, o Mythos Preview, em comparação ao trabalho sem IA.
Nas tarefas de engenharia mais complexas e menos especificadas, o Claude alcançou uma taxa de sucesso de 76% em maio de 2026, aumento de 50 pontos percentuais em seis meses.
O relatório traz um exemplo prático: quando uma atualização comum travou milhares de tarefas que a IA estava executando, um engenheiro pediu ajuda ao Claude. Ele explicou o problema em poucas palavras e deu ao assistente acesso aos computadores da empresa. Em apenas duas horas, a IA encontrou uma configuração oculta que estava causando o erro, testou a falha e resolveu o problema, um trabalho que normalmente exigiria de dois a três dias de um profissional humano.
A qualidade do código também acompanhou a curva. Segundo a Anthropic, o código gerado pelo Claude era "um pouco pior" que o humano no final de 2025, está em paridade atualmente e deve superá-lo ao longo deste ano.
De codificador a pesquisador
Em um experimento de abril de 2026, nove agentes paralelos foram colocados para trabalhar em um projeto de segurança de IA de ponta a ponta, sem supervisão contínua. Ao longo de cerca de 800 horas acumuladas e aproximadamente US$ 18 mil em computação, os agentes recuperaram 97% da lacuna de desempenho na tarefa. Dois pesquisadores humanos, trabalhando por uma semana, recuperaram 23%.
Outro teste mediu se o Claude seria capaz de escolher o "próximo passo" mais adequado em sessões reais de pesquisa. Em novembro de 2025, o modelo acertou o julgamento do pesquisador humano em 51% das situações. Em abril de 2026, esse número chegou a 64%.
Por que isso preocupa a Anthropic
O ponto mais significativo do relatório não é a produtividade. É o alerta sobre para onde esse caminho pode levar.
O documento descreve três cenários possíveis. No primeiro, a tendência desacelera, mas as capacidades atuais já reformulam a economia. No segundo, o desenvolvimento de IA se torna substancialmente automatizado enquanto humanos ainda definem a direção de pesquisa, o que permitiria que empresas de 100 pessoas façam o trabalho de organizações com 100 mil. No terceiro, os modelos atingem o autoaperfeiçoamento recursivo pleno e passam a projetar seus próprios sucessores.
Sobre esse terceiro cenário, a Anthropic admite não ter "boas intuições". A preocupação central é com o desalinhamento. Falhas raras e controláveis hoje poderiam se acumular de geração em geração de modelos até que o controle se torne inviável. O relatório alerta que esse desalinhamento pode ficar "cada vez mais frequente, mas cada vez menos compreendido, até perdermos o controle".
Proposta de pausa global
Para lidar com esse risco, o relatório propõe um mecanismo de pausa verificável e coordenado entre laboratórios de fronteira em diferentes países, com analogia explícita ao controle de armas nucleares.
A Anthropic é clara sobre os limites da ideia. Uma pausa unilateral apenas mudaria quem lidera a corrida. O que se propõe é um acordo no qual múltiplos laboratórios concordariam em parar sob as mesmas condições e verificariam o cumprimento uns dos outros.
O problema é que o treinamento de um modelo de IA é muito mais difícil de detectar do que testar um míssil, e o incentivo para descumprir o acordo silenciosamente é grande, especialmente em um mercado de IA para código que já movimenta dezenas de bilhões de dólares.
"Se fosse possível desacelerar o desenvolvimento dessa tecnologia para nos dar mais tempo para lidar com suas imensas implicações, acreditamos que isso provavelmente seria uma coisa boa", diz o relatório.
Vale notar que os dados apresentados são auto-reportados pela Anthropic e não foram auditados de forma independente. O relatório foi publicado dias depois de a empresa protocolar pedido de abertura de capital.