Publicidade

O que são os LLMs e por que se tornaram tão importantes?

Por  |  • 

Compartilhe:
Reprodução/Freepik
Reprodução/Freepik

O universo da tecnologia cria conceitos que rapidamente passam a fazer parte do vocabulário comum. Esse é o caso dos LLMs, iniciais de large language models, ou "grandes modelos de linguagem", ou ainda "modelos de linguagem de grande escala". Por sua vez, os LLMs incorporam outros conceitos essenciais, como PLN (Processamento de Linguagem Natural) e ML (Machine Learning, ou Aprendizado de Máquina), que aplica algoritmos de DL (Deep Learning, Aprendizado Profundo).

E essa salada de siglas é o que está por trás dos últimos grandes avanços tecnológicos, como a inteligência artificial generativa e, consequentemente, de ferramentas revolucionárias como o ChatGPT e o Bard. Por isso os LLMs são tão importantes.

Estes incríveis modelos de linguagem pré-treinados têm o poder de processar enormes quantidades de dados e, entre outras funcionalidades, gerar textos de forma surpreendentemente convincente. Em resumo, os LLMs são sistemas de IA capazes de entender, interpretar e criar linguagem humana e transferir conhecimentos de forma avançada e com infinitas possibilidades.

Canaltech
O Canaltech está no WhatsApp!Entre no canal e acompanhe notícias e dicas de tecnologia
Continua após a publicidade

Quanto mais informação absorvem, mais “inteligência” e capacidade de compreensão adquirem. Há quem acredite que os LLMs são o caminho para a tão sonhada Artificial General Intelligence (AGI, ou IA Geral), o Santo Graal da tecnologia, que seria capaz de pensar, aprender e resolver qualquer problema de raciocínio e entendimento. 

A qualidade e o potencial de um LLM dependem diretamente do treinamento pelo qual passou. Durante o treinamento, o modelo ajusta repetidamente os valores dos parâmetros até que seja capaz de prever corretamente a próxima leitura e a sequência anterior de entrada, por meio de técnicas de autoaprendizagem. Depois de treinados, os LLMs podem ser facilmente adaptados para realizar várias tarefas com o uso de conjuntos relativamente pequenos de dados supervisionados, em um processo de ajuste fino.

Entre as principais aplicações dos LLMs, podemos destacar a geração de códigos, a tradução e a sumarização automática de textos, a análise de reações e comportamentos nas redes sociais,  o uso em assistentes virtuais e chatbots, em pesquisas, na recuperação de informações e até na redução de tarefas monótonas e repetitivas. E há muito mais, já que também podem ser aplicados a diagnósticos médicos, no apoio à educação, no atendimento ao cliente e em setores como indústria, finanças, marketing e outros. 

Com um nível impressionante de compreensão da linguagem, os LLMs entraram de vez na vida das pessoas e utilizam redes neurais multicamadas e um número imenso de parâmetros. Por exemplo, o LLM de código aberto Breeze-7B lançado em março deste ano pela MediaTek Research utiliza 7 bilhões de parâmetros para absorver conhecimento adicional e compreender as mais intrincadas nuances linguísticas.

Existem LLMs proprietários e de código aberto, e o lançamento desses últimos democratizou o acesso à tecnologia de processamento de linguagem natural, já que agora podem ser utilizados livremente por desenvolvedores, organizações e empresas. Hoje existem inúmeros LLMs de código aberto, e entre os principais estão o Llama 2 e o OPT, da Meta; o Bert, do Google; o Bloom, da Hugging Face; o XGen-7B, da Salesforce; o MPT-7B, da MosaicML Foundation; o GPT-NeoX e o GPT-J, da EleutherAI; o Falcon 180B, do Technology Innovation Institute, e o Vicuna-13B, da LMSYS Org.

Para resumir, os LLMs representam uma conquista impressionante, com imenso potencial de aplicação nas mais diversas áreas. Estão presentes tanto em desafios científicos ultrassofisticados quanto no smartphone que você leva no bolso, nos textos que chegam às suas redes sociais e nas respostas que recebe ao ser atendido por um chatbot.

Samir Vani é diretor de desenvolvimento de negócios da MediaTek para a América Latina