Google cria tecnologia revolucionária que pode acabar com as fotos borradas

Google cria tecnologia revolucionária que pode acabar com as fotos borradas

Por Gustavo Minari | Editado por Douglas Ciriaco | 31 de Agosto de 2021 às 09h15
Reprodução/Google AI

Você já deve ter visto aquela cena em que o policial amplia imagens de satélite para identificar um rosto ou a placa de um carro. Longe dos cinemas, essa realidade é um tanto frustrante até para quem precisa realizar uma tarefa bem mais simples, como aumentar uma foto de família. Agora, pesquisadores do Google revelaram uma nova tecnologia que promete ampliações nítidas usando Inteligência Artificial (IA).

A Super-Resolução via Refinamentos Repetidos (SR3) é uma abordagem baseada em modelos probabilísticos que produz resultados com nitidez maior a partir de imagens pequenas e borradas, usando um algoritmo para combinar informações complementares de várias fontes diferentes.

Upscaling 2.0

Uma TV com “Upscaling” (aumento de escala, em tradução livre) consegue adaptar o conteúdo que você está vendo à resolução da sua tela. Essa tecnologia amplia os pixels e reconhece quais partes da imagem precisam ser otimizadas para melhorar a experiência ao assistir a filmes ou séries com resoluções mais baixas.

Quer ficar por dentro das melhores notícias de tecnologia do dia? Acesse e se inscreva no nosso novo canal no youtube, o Canaltech News. Todos os dias um resumo das principais notícias do mundo tech para você!

O SR3 usa um algoritmo com sistemas de redes neurais ResNet e PixelCNN projetadas para trabalhar em conjunto, preenchendo os detalhes que faltam nas imagens de baixa resolução para transformá-las em cópias de alta resolução. Em vez de “adivinhar” o que está faltando, esse novo upscaling reconstrói a imagem, entregando resultados muito mais nítidos.

Ruídos

Para melhorar a qualidade e a nitidez, o SR3 utiliza um modelo treinado para adicionar ruído progressivamente a uma imagem em alta resolução. Em seguida, o algoritmo “aprende” a reverter esse processo, removendo o ruído puro até alcançar um resultado semelhante em imagens com baixa resolução.

O sistema retira o ruído gaussiano (ruído branco) para melhorar o sinal de saída, utilizando um modelo U-Net — arquitetura de rede neural convolucional desenvolvida para segmentação de imagens — preparado para reduzir os ruídos em vários níveis de resolução. Isso garante um alto desempenho na ampliação de rostos e outros tipos de imagens.

Redução de ruídos para melhorar a qualidade da imagem (Imagem: Reprodução/Google AI)

Próxima geração

A Super-Resolução alcança resultados surpreendentes ao redimensionar imagens com resoluções até oito vezes menores, mantendo a qualidade e a nitidez. Esse modelo também pode ser usado para aumentar a clareza em imagens em cascata, ampliando o escalonamento constante com resoluções — uma imagem de 32×32, por exemplo, poderia chegar até 256x256 pixels.

Ampliação de imagens em cascata (Imagem: Reprodução/Google AI)

No futuro, essa tecnologia de aprimoramento de imagens sem perda de qualidade poderia equipar televisores, telescópios e celulares comuns, com sistemas avançados de superzoom, capazes de ampliar pessoas e objetos a quilômetros de distância, sem borrões ou distorções bizarras. Ainda está longe daquele policial de Hollywood que enxerga o branco dos olhos de um criminoso aproximando a fotografia tirada de um satélite, mas já dá para sonhar com uma câmera melhor.

Fonte: Google AI

Gostou dessa matéria?

Inscreva seu email no Canaltech para receber atualizações diárias com as últimas notícias do mundo da tecnologia.