Build 2015: Microsoft anuncia Azure Data Lake como repositório de big data

Por Redação | 29.04.2015 às 16:31

Durante a Build 2015 — conferência de desenvolvedores da Microsoft —, a companhia anunciou um novo repositório de dados para grande fluxo de análise de dados. Trata-se do Azure Data Lake, que terá como principal funcionalidade dar aos desenvolvedores um único local para armazenarem todos os seus dados estruturados e semi-estruturados em seu formato nativo sem a necessidade de se preocuparem com limitações de armazenamento e capacidade em arquivos individuais.

O Data Lake é compatível com o Hadoop, plataforma de software em Java voltada para processamento de grandes massas de dados. Sendo assim, o novo produto da empresa americana trabalhará em harmonia com todas as ferramentas de dados do Hadoop como Spark, Storm e Kafka, bem como os serviços de Hortonworks, Cloudera e Azure HDInsight, da Microsoft.

Com isso, a Microsoft quer permitir que os desenvolvedores usem as ferramentas com as quais já estão acostumados, que incluem o SQL e SQL Server ou Hadoop. "Nós queremos que os desenvolvedores utilizem as ferramentas e frameworks com que estão familiarizados e ainda sejam capazes de fazer todo o processamento de dados de uma forma amigável", observou o vice presidente corporativo da Microsoft em declaração ao TechCrunch. O executivo ainda afirmou que "estamos vivendo na era dourada dos dados".

Azure Data Lake

O Azure Data Lake foi construído em cima da rede Hyperscale do Azure e suporta arquivos individuais que podem ter múltiplos pentabytes em tamanho. Devido a isso, o serviço deve funcionar muito bem para sites em tempo real, Internet das Coisas e análise de sensores, bem como para serviços de dados orientados em lotes. No geral, o serviço é otimizado para análise de dados em grande escala para os desenvolvedores que sintam a necessidade de executar consultas maciçamente paralelas.

Agora, com o Azure Data Lake, os desenvolvedores poderão trabalhar com uma ampla variedade de formatos de dados. O serviço é a tentativa da Microsoft em permitir que os desenvolvedores armazenem seus dados em um repositório central e, em seguida, possam analisá-los com as ferramentas com que já estão familiarizados.

O serviço já está em pré-visualização e os desenvolvedores interessados poderão se cadastrar neste link.

Via TechCrunch

Fonte: http://techcrunch.com/2015/04/29/microsoft-announces-azure-data-lake-a-data-repository-for-big-data-analytics/?ncid=rss#.pq9nq3:JIF6