Google disponibiliza ferramenta de preparação de dados em versão de testes
Por Anderson Nascimento | 22 de Setembro de 2017 às 12h32
Durante a conferência Google Cloud Next em março, na cidade de São Francisco, nos Estados Unidos, a Google apresentou o Cloud Dataprep, um serviço de preparação de dados sem servidor que permite utilizar até mesmo modelos de treinamento de aprendizagem de máquina. Nos seis meses seguintes, a empresa disponibilizou o serviço em versão beta apenas para um número selecionado de interessados, mas agora foi anunciado que a ferramenta está disponível em beta público para quem desejar utilizar.
Alguns relatórios e pesquisas indicam que analistas e cientistas de dados podem gastar até 80% de seu tempo preparando dados brutos para análise. O Google Cloud Dataprep chega para automatizar este trabalho, detectando os tipos de dados, esquemas, junções e anomalias que contribuem significativamente para o trabalho dos profissionais e empresas que manuseiam uma grande quantidade de dados. A ferramenta integra-se nativamente a outros serviços, como o Cloud Storage, o BigQuery e o Google Cloud Platform (GCP).
O aprendizado de máquina permite que este processo seja melhorado à medida que o serviço é mais utilizado, sugerindo maneiras diferentes de limpar os dados, o que torna o processo mais rápido e também menos suscetível a erros. Um outro destaque do Google Cloud Dataprep é seu layout, que torna mais fácil para aqueles que não são engenheiros de dados alterar ou adicionar um conjunto de dados e informações.
"O Cloud Dataprep também possui inteligência interna para entender e operacionalizar automaticamente seus padrões de uso específicos, tornando a preparação de dados ainda mais rápida e menos propensa ao erro do usuário", explicou Eric Anderson, gerente de produtos da Google. "O resultado geral é mais produtivo, eficiente e poderoso", completou. O Cloud Dataprep é uma versão incorporada do aplicativo empresarial Wrangler da Trifacta, que possui a mesma tarefa de preparação de dados.
No ano passado, um dos principais concorrentes da Google na área, a Amazon, já havia lançado sua própria ferramenta de preparação de dados sem servidor, chamada de AWS Glue.
Fonte: VentureBeat