Concorrente do ChatGPT lança IA multimodal que processa texto e imagem
Por Guilherme Haas |
A startup francesa Mistral lançou o Pixtral 12B, seu primeiro modelo de inteligência artificial multimodal. Capaz de processar tanto texto quanto imagens, o modelo conta com 12 bilhões de parâmetros e pode realizar tarefas como legendar imagens e identificar objetos em fotos.
Pixtral 12B foi construído com base no modelo de texto Nemo 12B, também da Mistral, e tem um tamanho aproximado de 24GB. O modelo permite respostas a perguntas baseadas em imagens de diferentes tamanhos e fontes, seja por meio de URLs ou imagens codificadas em base64.
Assim como outras IAs multimodais, como o GPT-4 da OpenAI, o Pixtral 12B pode ser usado em uma variedade de contextos, incluindo plataformas de chatbot e APIs.
Disponibilidade do Pixtral 12B
O modelo está disponível gratuitamente para download via GitHub e Hugging Face, sob a licença Apache 2.0, o que permite seu uso e modificação sem restrições. Segundo Sophia Yang, chefe de relações com desenvolvedores da Mistral, ele será integrado em breve às plataformas da empresa, Le Chat e Le Plateforme, para testes.
Ainda não está claro quais dados de imagem foram usados para treinar o Pixtral 12B. Modelos de IA gerativa, como os da Mistral, são normalmente treinados com grandes quantidades de dados públicos da internet, o que levanta questões sobre direitos autorais. Recentemente, grandes empresas de IA enfrentaram processos judiciais relacionados ao uso de dados protegidos por copyright.
Leia mais sobre o debate entre treinamento de IAs e direitos autorais:
- Autores processam Anthropic por treinar a IA Claude com livros pirateados
- ChatGPT | OpenAI revela riscos e respostas inesperadas do GPT-4o
- Como os dados na web são coletados para desenvolver IAs
- Por que o X/Twitter gera imagens polêmicas que outras IAs bloqueiam?
- Gravadoras processam IAs de música por violação de direitos autorais
O lançamento do Pixtral 12B acontece após a Mistral concluir uma rodada de financiamento de US$ 645 milhões, elevando o valor da empresa para US$ 6 bilhões. Com participação minoritária da Microsoft, a Mistral tem sido vista como a resposta europeia à OpenAI, apostando em modelos de IA abertos ao público.
Veja também: Mistral lança modelo de IA Large 2 com suporte ao português