Google cria tecnologia revolucionária que pode acabar com as fotos borradas
Por Gustavo Minari • Editado por Douglas Ciriaco |
Você já deve ter visto aquela cena em que o policial amplia imagens de satélite para identificar um rosto ou a placa de um carro. Longe dos cinemas, essa realidade é um tanto frustrante até para quem precisa realizar uma tarefa bem mais simples, como aumentar uma foto de família. Agora, pesquisadores do Google revelaram uma nova tecnologia que promete ampliações nítidas usando Inteligência Artificial (IA).
- Huawei demonstra IA capaz de converter vídeos de 480p para Full HD
- O que é Upscaling e quais TVs tem essa tecnologia?
- Com DLSS 2.0, Nvidia quer revolucionar gráficos nos games; veja como
A Super-Resolução via Refinamentos Repetidos (SR3) é uma abordagem baseada em modelos probabilísticos que produz resultados com nitidez maior a partir de imagens pequenas e borradas, usando um algoritmo para combinar informações complementares de várias fontes diferentes.
Upscaling 2.0
Uma TV com “Upscaling” (aumento de escala, em tradução livre) consegue adaptar o conteúdo que você está vendo à resolução da sua tela. Essa tecnologia amplia os pixels e reconhece quais partes da imagem precisam ser otimizadas para melhorar a experiência ao assistir a filmes ou séries com resoluções mais baixas.
O SR3 usa um algoritmo com sistemas de redes neurais ResNet e PixelCNN projetadas para trabalhar em conjunto, preenchendo os detalhes que faltam nas imagens de baixa resolução para transformá-las em cópias de alta resolução. Em vez de “adivinhar” o que está faltando, esse novo upscaling reconstrói a imagem, entregando resultados muito mais nítidos.
Ruídos
Para melhorar a qualidade e a nitidez, o SR3 utiliza um modelo treinado para adicionar ruído progressivamente a uma imagem em alta resolução. Em seguida, o algoritmo “aprende” a reverter esse processo, removendo o ruído puro até alcançar um resultado semelhante em imagens com baixa resolução.
O sistema retira o ruído gaussiano (ruído branco) para melhorar o sinal de saída, utilizando um modelo U-Net — arquitetura de rede neural convolucional desenvolvida para segmentação de imagens — preparado para reduzir os ruídos em vários níveis de resolução. Isso garante um alto desempenho na ampliação de rostos e outros tipos de imagens.
Próxima geração
A Super-Resolução alcança resultados surpreendentes ao redimensionar imagens com resoluções até oito vezes menores, mantendo a qualidade e a nitidez. Esse modelo também pode ser usado para aumentar a clareza em imagens em cascata, ampliando o escalonamento constante com resoluções — uma imagem de 32×32, por exemplo, poderia chegar até 256x256 pixels.
No futuro, essa tecnologia de aprimoramento de imagens sem perda de qualidade poderia equipar televisores, telescópios e celulares comuns, com sistemas avançados de superzoom, capazes de ampliar pessoas e objetos a quilômetros de distância, sem borrões ou distorções bizarras. Ainda está longe daquele policial de Hollywood que enxerga o branco dos olhos de um criminoso aproximando a fotografia tirada de um satélite, mas já dá para sonhar com uma câmera melhor.
Fonte: Google AI