CodeFlare da IBM promete automatizar a configuração de sistemas de IA
Por Felipe Gugelmin | Editado por Claudio Yuge | 08 de Julho de 2021 às 21h40
A IBM anunciou na última quarta-feira (7) o lançamento do CloudFare, uma nova estrutura de código aberto que facilita os processos de configuração e testes de plataformas que fazem testes de aprendizado por máquina. A tecnologia promete ser uma solução completa para diversos setores, especialmente em um momento no qual a tecnologia artificial se expande e resulta em um fluxo de grandes quantidades de dados.
- Brechó de luxo online aposta em inteligência artificial para verificar peças
- Inteligência artificial do TikTok está à venda e empresas já podem comprá-la
- Inteligência artificial vê vídeos e aprende a antecipar comportamentos humanos
Para demonstrar o funcionamento da plataforma, a empresa a usou para analisas e otimizar aproximadamente 100 mil pipelines (uma série de elementos de processamento conectados em série) responsáveis por treinar modelos de aprendizado de máquina. Enquanto modelos anteriores demorariam 4 horas para finalizar o processo, o CodeFlare ajudou a reduzir o tempo necessário para somente 15 minutos.
A novidade é construída em Ray, uma tecnologia aberta para “distribuição rápida e simples de computação”, nas palavras da IBM. Usando uma interface baseada em Python, o CodeFlare simplifica processos de treinamento de modelos de aprendizado — como a limpeza de dados, extração de recursos e otimização de modelo — em um novo pipeline que simplifica etapas de integração, paralelização e compartilhamento de dados.
O objetivo da nova estrutura criada pela empresa é unificar fluxo de pipeline em várias plataformas. Com isso, cientistas de dado não precisam aprender uma nova linguagem de fluxo de trabalho, e pesquisadores podem se concentrar em fazer ciência no tempo em que teriam que esperar pela configuração dos sistemas.
Projeto já está no GitHub
O CodeFlare funciona a partir da nova plataforma serveless IBM Cloud Core Engine e Red Hat OpenShift e pode ser implementado em quase qualquer lugar. O sistema também permite integrar e fazer pontos com outros ecossistemas nativos à nuvem e fornecer adaptadores para acionadores de eventos. Outras aplicações incluem o carregamento e a partição de dados de uma gama ampla de fontes, incluindo sistemas de arquivos distribuídos, data lakes e armazenamentos de objetos em nuvem.
O projeto da nova tecnologia já está disponível no GitHub, em uma página que inclui as instruções e requisitos necessários para utilizá-lo. A própria IBM afirmou que já está aplicando o recurso em sua pesquisa de inteligência artificial e que pretende continuar investindo em atualizações que permitirão trabalhar com fluxos mais intensos de dados e pipelines ainda mais complexas.
Fonte: IBM Research