Publicidade
Economize: canal oficial do CT Ofertas no WhatsApp Entrar

Esteganografia: a história das mensagens ocultas e como chegaram ao ChatGPT

Por| Editado por Luciana Zaramela | 17 de Junho de 2023 às 09h00

Link copiado!

Alveni Lisboa/Canaltech
Alveni Lisboa/Canaltech

Você conhece o termo “esteganografia”? Não? Ironicamente, esse conceito é definido como o método de se esconder uma mensagem dentro de outra mensagem, gerando o fenômeno de se ler uma palavra ou frase e não saber o seu significado, como acabou de acontecer, caso você não conhecesse o termo. Ele se diferencia da criptografia, que embaralha uma mensagem, mas deixa claro que há algo escondido — na esteganografia, esconde-se o fato de que há um segredo.

Um acontecimento recente que trouxe esse método à tona foi a prisão de espiões russos em Nova York, em 2010, que revelou toda uma rede de identidades falsas e encontros clandestinos, utilizando métodos esteganográficos. Isso expôs uma das maiores redes de espionagem desde a Guerra Fria e até inspirou a criação de uma série de TV, The Americans.

A parte complicada acerca da esteganografia, atualmente, está no poder computacional atingido pelas máquinas. Antigamente, quando um ser humano não suspeitava da existência da mensagem, isso bastava para o segredo estar bem guardado. Agora, também é preciso esconder a comunicação das máquinas.

Continua após a publicidade

Na verdade, detectar a presença de uma mensagem escondida já faz o comunicador original perder — embora a possibilidade teórica de atingir uma mensagem perfeitamente oculta exista, inclusive no campo estatístico, a comunicação humana atual considera isso impossível.

A esteganografia pela história

A esteganografia vem do grego, significando “escrita escondida”, e é deles que vêm os primeiros relato, com Histórias, de Heródoto, do século 5 a.C. Ele relata a manufatura de mensagens em madeira cobertas com camadas de cera, o uso de tinta invisível sobre certas letras e um método mais extremo, onde o líder Histieu tatuou uma mensagem na cabeça de um escravo, deixou seu cabelo crescer e o enviou para o sobrinho, que raspou o cabelo do serviçal e revelou a comunicação.

Evoluindo as técnicas, na 1ª Guerra Mundial, espiões alemães reduziam documentos a tamanhos que chegavam ao pingo da letra “i”, aparentemente sem nada escondido, mas revelando mensagens com o uso de lupas. Em 1980, a primeira-ministra britânica Margaret Thatcher teria reprogramado as máquinas dos ministros para que cada um tivesse documentos com espaçamentos únicos e diferenciados, mas de forma quase imperceptível, facilitando a identificação de vazamentos ao permitir saber quem os liberou.

Atualmente, técnicas como tinta invisível ainda são usadas (tendo ocorrido no caso russo de 2010), mas a esteganografia também permite esconder assinatura de artistas em detalhes de pinturas, projetar áudios para ter trilhas escondidas ou reversas ou até mesmo texto. Tecnologias digitais permitem esconder imagens em mensagens de voz e colocar texto escrito em fotografias manipuladas, por exemplo, como utilizado na rede de espionagem nova-iorquina.

Computadores e esteganografia

Continua após a publicidade

A esteganografia só foi ganhar regras matemáticas e formais nos anos 1980, usando a teoria da informação cunhada por Claude Shannon em 1948, que trazia uma maneira analítica de se pensar no envio e recebimento de informações. O autor usou o termo “entropia” para quantificar a quantidade de informação em uma variável — ou seja, o número de bits necessários para codificar uma letra ou mensagem — e deu regras para a criptografia segura.

Christian Cachin, cientista da computação e criptógrafo da Universidade de Bern, começou a aplicar a probabilística na esteganografia quase 50 anos depois.

Para compreender melhor, pensemos no seguinte exemplo: João e Maria são agentes que precisam se comunicar sem que Carlos, seu adversário, perceba. João envia palavras selecionadas do léxico da língua portuguesa. Cada uma tem uma probabilidade associada — a palavra “cada”, por exemplo, é mais provável de aparecer do que a palavra “léxico”. As palavras, no final, podem ser representadas como uma distribuição de probabilidades, com cada texto tendo sua própria distribuição com o uso de esteganografia.

Continua após a publicidade
No exemplo acima, a imagem da direita é escondida na imagem da esquerda por entre os pixels

Teóricos da informação usam uma medida chamada entropia relativa para comparar as probabilidades de distribuição. É como medir uma distância abstrata. Caso a entropia relativa entre duas distribuições seja 0, não há como usar análise estatística para revelar a mensagem. Em outras palavras, caso espiões futuros desenvolvam um algoritmo perfeitamente seguro para contrabandear segredos, nenhum sistema conseguirá detectá-los.

O problema é que, para fazer isso, é preciso usar alguma ferramenta que simule perfeitamente a linguagem humana, caso o segredo esteja em texto. Quando gerado por humanos, o resultado é bastante bagunçado, e chegamos perto com modelos de linguagem como o ChatGPT, mas a simulação gerada é, no máximo, convincente — mas não exata. Ainda é possível notar que o texto foi gerado por uma inteligência artificial, o que derruba o propósito. A simulação perfeita é complexa demais, e provavelmente nunca será atingida, segundo especialistas.

A esteganografia perfeita

Continua após a publicidade

Alguns pesquisadores, no entanto, seguem teorizando. Dois deles são Samuel Sokota e Schroeder de Witt, cientistas da computação trabalhando com aprendizado de máquina e estudando maneiras de passar informação por vários canais diferentes. Eles descobriram um novo conceito na teoria da informação chamado “acoplamento de entropia mínimo”.

Nele, é possível combinar duas distribuições de probabilidade em uma distribuição única, representando ambos os sistemas. Na esteganografia, uma delas representa o texto de cobertura, que não quer dizer nada, e a outra o texto cifrado, que traz a mensagem secreta. Essa distribuição conjunta garante que os dois textos sejam estatisticamente indistinguíveis, ou seja, gerem uma mensagem perfeitamente segura.

Inicialmente, a equipe estava usando esses conceitos para o aprendizado profundo de máquina, mas percebeu que a esteganografia teria a aplicação perfeita para a teoria. O problema é que, para atingir um acoplamento de entropia mínimo, é necessário muito poder computacional, tornando a tecnologia cara e pouco prática, pecando na eficiência.

Continua após a publicidade

Os pesquisadores conseguem, por enquanto, calcular aproximações que garantem certa segurança e eficiência, embora não sejam perfeitas. A pesquisa ainda trata muito do campo teórico, e sua aplicação futura irá depender de quanto conteúdo gerado por máquinas será usado nos próximos anos, como os feitos pelo ChatGPT, Midjourney e afins.

Caso caiam em desuso, usar cálculos estatísticos como os de Sokota e DeWitt não garantirá segurança, já que será fácil detectar mensagens e imagens geradas por IA. Por fim, há a possibilidade de que tais tecnologias sejam usadas para o mal, mas isso é uma questão que permeia qualquer nova tecnologia. O futuro dirá — de formas ocultas ou não.

Fonte: Quanta Magazine, arXiv, PNAS