Economize: canal oficial do CT Ofertas no WhatsApp Entrar

Microsoft Build 2024 | Novo modelo de IA da MS lê gráficos e tabelas

Por| Editado por Douglas Ciriaco | 21 de Maio de 2024 às 12h30

Turag Photography/Unsplash
Turag Photography/Unsplash
Microsoft
Tudo sobre Microsoft
Continua após a publicidade

A Microsoft lançou um novo modelo multimodal chamado Phi-3-Vision com capacidade para realizar tarefas gerais que envolvem o raciocínio visual, como lidar com gráficos e tabelas. A IA faz parte da família de modelos de pequena escala (SLMs) da companhia, dimensionada em 4,2 bilhões de parâmetros — em comparação, o ChatGPT tem 175 bilhões de parâmetros. A novidade foi revelada nesta terça-feira (21), durante a Microsoft Build 2024.

A família de modelos de linguagem de pequena escala Phi foi apresentada pela primeira vez no ano passado como uma solução própria da Microsoft no segmento de inteligência artificial e um “plano B” em relação às soluções licenciadas da OpenAI.

Modelos Phi da Microsoft

Apesar de contar com menos parâmetros do que as concorrentes do mercado, os modelos Phi da Microsoft apresentam bons resultados em testes de benchmark. O modelo Phi-2, lançado em dezembro, chegou a igualar a pontuação de modelos até 25x maiores “graças a inovações no dimensionamento do modelo e na curadoria de dados de treinamento”, segundo a companhia.

O Phi-3-Vision, que chega agora em versão prévia, tem maior dimensão em relação ao Phi-2 (de 2,7 para 4,2 bilhões de parâmetros) e segue a proposta de ser um modelo otimizado para o uso em aparelhos pessoais.

De acordo com o anúncio da Big Tech de Redmond, “o modelo tem a capacidade de compreender imagens e textos e gerar respostas em texto. Por exemplo, os usuários podem fazer perguntas sobre um gráfico ou fazer perguntas abertas sobre imagens específicas”.

Microsoft lança nova IA com foco em raciocínio visual (Imagem: Turag Photography/Unsplash)
Microsoft lança nova IA com foco em raciocínio visual (Imagem: Turag Photography/Unsplash)
Continua após a publicidade

O foco do novo SLM está na realização de tarefas com componentes visuais, como analisar os conteúdos de tabelas, gráficos, mapas, imagens e outras representações gráficas.

Junto com a apresentação do Phi-3-Vision, a Microsoft anunciou nesta terça-feira (21) que os modelos Phi-3-mini e Phi-3-medium agora estão disponíveis no Microsoft Azure AI, como parte da oferta de modelos como serviço (MaaS). O Phi-3-small também já está disponível.