Pesquisadores são capazes de identificar consumidores a partir de Big Data

Por Redação | 13 de Fevereiro de 2015 às 10h15

A essa altura do campeonato, todo mundo já deve saber que o cuidado com as informações pessoais postadas em redes sociais é necessário, principalmente quando se deseja evitar a identificação de hábitos, dados pessoais ou compras. Mas um novo estudo publicado pela revista Science mostra que mesmo informações aparentemente distantes umas das outras podem levar à localização de pessoas, por meio de algoritmos que fazem uso do Big Data.

Na pesquisa, dados aleatórios de 1,1 milhão de pessoas e 10 mil estabelecimentos comerciais foram usados para verificar a teoria. Informações como dados pessoais, números de cartões de crédito e até mesmo o horário em que as compras foram realizadas foram deixados de lado, em um estudo que contou com a participação de um “grande banco”. O país em que o estudo ocorreu, porém, não foi revelado, assim como as instituições envolvidas na entrega dos dados.

O que ficou bem flagrante, porém, é que mesmo sem tais dados específicos, os participantes do estudo foram capazes de identificar com sucesso 90% das pessoas presentes nos dados. Tudo aconteceu por meio de algoritmos que cruzaram informações de redes sociais, geolocalização, fotos publicadas ou até mesmo hábitos e gostos revelados em mensagens públicas. Em alguns casos, apenas quatro instâncias de dados foram necessárias para obter um resultado positivo.

Em muitos casos, por exemplo, sistemas de localização ativados nos celulares – muitas vezes sem que os próprios usuários saibam disso – entregaram preferências por um determinado estabelecimento ou região. Com postagens constantes em redes sociais sobre fitness, por exemplo, os estudiosos foram capazes de relacionar a pessoa aos gastos feitos em uma determinada academia, mesmo sem dados específicos sobre isso.

O problema começa quando artifícios desse tipo podem ser usados também por criminosos para obtenção dos dados pessoais que não aparecem na nuvem de Big Data. No que vem sendo chamado de “ataque de correlação”, algoritmos como os colocados em prática pelo estudo também podem estar ativos nas mãos de hackers, gerando ataques de phishing mais precisos e com maior chance de sucesso na obtenção das informações. E esse é apenas um exemplo de utilização maliciosa do conceito.

De acordo com os pesquisadores, a melhor maneira de evitar cair em golpes desse tipo é reduzir as pegadas digitais, algo que pode parecer mais fácil de falar do que de fazer. Muitas vezes, mensagens impensadas, individualmente, podem não significar nada, mas em conjunto com outros diversos dados que entregamos de bom grado à internet todos os dias, podem compor um retrato que não gostaríamos de ver em mãos erradas.

Fique por dentro do mundo da tecnologia!

Inscreva-se em nossa newsletter e receba diariamente as notícias por e-mail.