Meta lança Llama 3.2, modelo de IA que “compreende” imagem e texto
Por Emanuele Almeida |
A Meta lançou o Llama 3.2, seu conjunto mais recente de modelos de inteligência artificial (IA), durante o evento Meta Connect 2024, nesta quarta-feira (25). As inovações incluem modelos de visão e modelos de texto compactos, assim como a interpretação visual de dados. As novidades estão disponíveis aos desenvolvedores para download no site oficial da companhia.2 e no Hugging Face.
- Clique e siga o Canaltech no WhatsApp
- Meta vai usar IA para dublar vídeos dos Reels em outros idiomas
- Meta AI ganha suporte a comandos de voz no Instagram e WhatsApp
Os modelos de visão são capazes de interpretar informações contidas em imagens, gráficos e mapas. Além disso, o lançamento oferece opções abertas e fechadas, que suportam tarefas de reconhecimento de imagem e legendagem automática. Esses modelos variam de 11 bilhões a 90 bilhões de parâmetros.
De acordo com a Meta, o Llama 3.2 pode analisar um gráfico de vendas de uma empresa e, se solicitado, identificar em qual mês a empresa teve o melhor desempenho de vendas. No que diz respeito à legendagem, os modelos de 11B e 90B podem gerar uma ou duas frases como legenda de uma imagem, a partir da análise dos detalhes contidos nela.
Llama 3.2 para celulares
Para celulares, o Llama 3.2 estará disponível em versões menores, com 1 bilhão e 3 bilhões de parâmetros, adequadas para dispositivos móveis ou para edge computing – um sistema composto por data centers menores que operam na periferia da rede, processando dados localmente e mais próximo da fonte.
Os modelos para dispositivos móveis são compatíveis com chips das principais fabricantes de componentes para celulares, Qualcomm e MediaTek, e são otimizados para processadores com arquitetura ARM, comuns em aparelhos compactos e consomem menos energia, por exemplo.
Segurança e integração
Para enfatizar seu compromisso com a segurança e a ética no uso da IA, a Meta também introduziu o Llama Guard 3, um sistema de segurança que monitora as entradas e saídas de texto e imagens dos modelos, assegurando que as aplicações sejam desenvolvidas de maneira responsável.
Em termos de integração, a empresa lançou o Llama Slack, um conjunto de ferramentas que facilitam o uso e a personalização dos modelos Llama em diferentes ambientes, como na nuvem ou localmente em smartphones.
Veja outras matérias do Canaltech:
- Mira Murati | CTO da OpenAI, dona do ChatGPT, deixa empresa
- Modo de conversa do ChatGPT ganha novas vozes e mudança no visual
- Carbono da antiga atmosfera de Marte pode virar combustível
Vídeo: Ray-Ban Meta Smart Glasses, os óculos com câmera, processador Snapdragon e que detestam água
Fonte: