Publicidade

Concorrente do ChatGPT lança IA multimodal que processa texto e imagem

Por  | 

Compartilhe:
Solen Feyissa/Unsplash
Solen Feyissa/Unsplash

A startup francesa Mistral lançou o Pixtral 12B, seu primeiro modelo de inteligência artificial multimodal. Capaz de processar tanto texto quanto imagens, o modelo conta com 12 bilhões de parâmetros e pode realizar tarefas como legendar imagens e identificar objetos em fotos.

Pixtral 12B foi construído com base no modelo de texto Nemo 12B, também da Mistral, e tem um tamanho aproximado de 24GB. O modelo permite respostas a perguntas baseadas em imagens de diferentes tamanhos e fontes, seja por meio de URLs ou imagens codificadas em base64.

Assim como outras IAs multimodais, como o GPT-4 da OpenAI, o Pixtral 12B pode ser usado em uma variedade de contextos, incluindo plataformas de chatbot e APIs.

Canaltech
O Canaltech está no WhatsApp!Entre no canal e acompanhe notícias e dicas de tecnologia
Continua após a publicidade

Disponibilidade do Pixtral 12B

O modelo está disponível gratuitamente para download via GitHub e Hugging Face, sob a licença Apache 2.0, o que permite seu uso e modificação sem restrições. Segundo Sophia Yang, chefe de relações com desenvolvedores da Mistral, ele será integrado em breve às plataformas da empresa, Le Chat e Le Plateforme, para testes.

Ainda não está claro quais dados de imagem foram usados para treinar o Pixtral 12B. Modelos de IA gerativa, como os da Mistral, são normalmente treinados com grandes quantidades de dados públicos da internet, o que levanta questões sobre direitos autorais. Recentemente, grandes empresas de IA enfrentaram processos judiciais relacionados ao uso de dados protegidos por copyright.

Leia mais sobre o debate entre treinamento de IAs e direitos autorais:

O lançamento do Pixtral 12B acontece após a Mistral concluir uma rodada de financiamento de US$ 645 milhões, elevando o valor da empresa para US$ 6 bilhões. Com participação minoritária da Microsoft, a Mistral tem sido vista como a resposta europeia à OpenAI, apostando em modelos de IA abertos ao público.

Veja tambémMistral lança modelo de IA Large 2 com suporte ao português