Microsoft Build 2024 | Novo modelo de IA da MS lê gráficos e tabelas
Por Guilherme Haas • Editado por Douglas Ciriaco |

A Microsoft lançou um novo modelo multimodal chamado Phi-3-Vision com capacidade para realizar tarefas gerais que envolvem o raciocínio visual, como lidar com gráficos e tabelas. A IA faz parte da família de modelos de pequena escala (SLMs) da companhia, dimensionada em 4,2 bilhões de parâmetros — em comparação, o ChatGPT tem 175 bilhões de parâmetros. A novidade foi revelada nesta terça-feira (21), durante a Microsoft Build 2024.
- Apple lança novo modelo de linguagem e avança no mundo da IA
- Microsoft pode lançar chip próprio de IA para frear Nvidia
A família de modelos de linguagem de pequena escala Phi foi apresentada pela primeira vez no ano passado como uma solução própria da Microsoft no segmento de inteligência artificial e um “plano B” em relação às soluções licenciadas da OpenAI.
Modelos Phi da Microsoft
Apesar de contar com menos parâmetros do que as concorrentes do mercado, os modelos Phi da Microsoft apresentam bons resultados em testes de benchmark. O modelo Phi-2, lançado em dezembro, chegou a igualar a pontuação de modelos até 25x maiores “graças a inovações no dimensionamento do modelo e na curadoria de dados de treinamento”, segundo a companhia.
O Phi-3-Vision, que chega agora em versão prévia, tem maior dimensão em relação ao Phi-2 (de 2,7 para 4,2 bilhões de parâmetros) e segue a proposta de ser um modelo otimizado para o uso em aparelhos pessoais.
De acordo com o anúncio da Big Tech de Redmond, “o modelo tem a capacidade de compreender imagens e textos e gerar respostas em texto. Por exemplo, os usuários podem fazer perguntas sobre um gráfico ou fazer perguntas abertas sobre imagens específicas”.
O foco do novo SLM está na realização de tarefas com componentes visuais, como analisar os conteúdos de tabelas, gráficos, mapas, imagens e outras representações gráficas.
Junto com a apresentação do Phi-3-Vision, a Microsoft anunciou nesta terça-feira (21) que os modelos Phi-3-mini e Phi-3-medium agora estão disponíveis no Microsoft Azure AI, como parte da oferta de modelos como serviço (MaaS). O Phi-3-small também já está disponível.