Publicidade

Como a Coca-Cola criou uma IA poderosa e de baixo uso de memória em celulares?

Por| 30 de Março de 2020 às 21h00

Link copiado!

The Intercept
The Intercept

A Inteligência Artificial (IA) está ocupando cada vez mais espaço. De assistentes virtuais à seleção customizadas de programação em plataformas de streaming, passando pelas campanhas promocionais de produtos. Agora, a Coca-Cola mostra como os algoritmos e a visão computacional foram utilizados para fidelizar os clientes — algo que deveremos ver em várias outras frentes de marketing daqui para frente.

A novidade foi explicada pelo diretor de Tecnologia da Informação e estrategista de soluções da Coca-Cola, Patrick Brandt, durante apresentação no TensorFlow Dev Summit de 2018 — e veio a público agora porque é algo que outras companhias também estão adotando, pois a ideia aparentemente é simples, mas exige um treinamento preciso da IA, assim como o uso das ferramentas adequadas e boa execução de toda a campanha.

A iniciativa em questão era uma ação em que os consumidores recebiam recompensas na compra dos refrigerantes. Para isso, eles precisavam provar que adquiriram os produtos, a partir de um código PIN de 14 caracteres, que vinha nas tampas e nas embalagens das garrafas. Para obter os prêmios, era preciso digitalizá-los com a ajuda da câmera do smartphone.

Continua após a publicidade

Coca-Cola precisou criar um app do zero

Mas como evitar fraudes ou erros no reconhecimento desses códigos em um utilitário que use pouca memória em um dispositivo móvel? Como a Coca-Cola estava imprimindo as sequências em um formato que não era facilmente reconhecível pelos então mais populares métodos conhecidos de reconhecimento ótico de caracteres (ou OCR, na sigla em inglês), a empresa decidiu criar sua própria rede neural para isso. Assim, nasceu a sua própria Rede Neural Convolucional (CNN, na sigla em inglês) para detectar recursos de uma imagem e reconhecer os PIN impressos.

O usuário tira uma foto da tampa da garrafa e, em seguida, a biblioteca aberta de visão computacional OpenCV detecta o Local de Interesse na imagem (ROI, na sigla em inglês), ou seja, a tampa da garrafa ou o espaço da embalagem, ignorando o fundo e outros detalhes irrelevantes. O ROI identificado é então cortado e normalizado. O reconhecimento de caracteres feito com a ajuda da CNN.

Continua após a publicidade

A CNN gera uma matriz de probabilidade de caracteres e as dez principais previsões são retiradas. Em seguida, os códigos PIN são verificados quanto à validade e, se forem autênticos e premiados, o usuário recebe a recompensa.

IA poderosa para o consumidor final

O desenvolvimento do modelo da CNN para OCR na Coca-Cola passou por três grandes fases. A equipe de ciência de dados da companhia usou o método de binarização para separar os elementos de fundo da imagem. Como havia perdas de dados nos testes iniciais, foi preciso usar uma IA mais poderosa para melhorar a conversão — o que acarretou em um uso muito grande de memória, algo que não é o mais indicado para um aplicativo móvel.

Continua após a publicidade

Então, o modelo foi descartado e os pesquisadores usaram um SqueezeNet, que é justamente uma rede neural mais compacta, desenvolvida especialmente para ser utilizada em dispositivos com relativa pouca memória. Isso gerou outro problema, pois essa solução não pôde calcular mudanças de co-variáveis internas — que normalmente não são controladas durante a coleta de dados.

A Normalização de Lotes, que usa estatísticas de normalização diferentes para cada etapa do tempo de armazenamento, diminuiu o tempo de treinamento da IA e, com isso, o SqueezeNet conseguiu chegar ao uso de 5 Mb — uma redução de 25 vezes em relação ao modelo inicial que a Coca-Cola havia construído —, com precisão agora superior a 95%.

Assim, nasceu o app capaz de executar bem todo o processo, resolvendo fechamento, tradução, rotação e foco da câmera. O maior mérito do grupo de cientistas nesse exemplo foi conseguir gerar uma IA com procedimentos complexos em um app de baixo consumo de memória e entregue ao consumidor final em larga escala, com todo o processamento realizado em um celular. E isso abre muitas portas para seu uso em campanhas de marketing semelhantes.

Continua após a publicidade

Fonte: The Click Reader