CodeFlare da IBM promete automatizar a configuração de sistemas de IA

Por Felipe Gugelmin | Editado por Claudio Yuge | 08 de Julho de 2021 às 21h40
Divulgação/IBM Research

A IBM anunciou na última quarta-feira (7) o lançamento do CloudFare, uma nova estrutura de código aberto que facilita os processos de configuração e testes de plataformas que fazem testes de aprendizado por máquina. A tecnologia promete ser uma solução completa para diversos setores, especialmente em um momento no qual a tecnologia artificial se expande e resulta em um fluxo de grandes quantidades de dados.

Para demonstrar o funcionamento da plataforma, a empresa a usou para analisas e otimizar aproximadamente 100 mil pipelines (uma série de elementos de processamento conectados em série) responsáveis por treinar modelos de aprendizado de máquina. Enquanto modelos anteriores demorariam 4 horas para finalizar o processo, o CodeFlare ajudou a reduzir o tempo necessário para somente 15 minutos.

Quer ficar por dentro das melhores notícias de tecnologia do dia? Acesse e se inscreva no nosso novo canal no youtube, o Canaltech News. Todos os dias um resumo das principais notícias do mundo tech para você!

A novidade é construída em Ray, uma tecnologia aberta para “distribuição rápida e simples de computação”, nas palavras da IBM. Usando uma interface baseada em Python, o CodeFlare simplifica processos de treinamento de modelos de aprendizado — como a limpeza de dados, extração de recursos e otimização de modelo — em um novo pipeline que simplifica etapas de integração, paralelização e compartilhamento de dados.

Imagem: Divulgação/IBM Research

O objetivo da nova estrutura criada pela empresa é unificar fluxo de pipeline em várias plataformas. Com isso, cientistas de dado não precisam aprender uma nova linguagem de fluxo de trabalho, e pesquisadores podem se concentrar em fazer ciência no tempo em que teriam que esperar pela configuração dos sistemas.

Projeto já está no GitHub

O CodeFlare funciona a partir da nova plataforma serveless IBM Cloud Core Engine e Red Hat OpenShift e pode ser implementado em quase qualquer lugar. O sistema também permite integrar e fazer pontos com outros ecossistemas nativos à nuvem e fornecer adaptadores para acionadores de eventos. Outras aplicações incluem o carregamento e a partição de dados de uma gama ampla de fontes, incluindo sistemas de arquivos distribuídos, data lakes e armazenamentos de objetos em nuvem.

O projeto da nova tecnologia já está disponível no GitHub, em uma página que inclui as instruções e requisitos necessários para utilizá-lo. A própria IBM afirmou que já está aplicando o recurso em sua pesquisa de inteligência artificial e que pretende continuar investindo em atualizações que permitirão trabalhar com fluxos mais intensos de dados e pipelines ainda mais complexas.

Fonte: IBM Research

Gostou dessa matéria?

Inscreva seu email no Canaltech para receber atualizações diárias com as últimas notícias do mundo da tecnologia.