Publicidade

OpenAI lança o modelo o1 com foco em resolver problemas complexos

Por  | 

Compartilhe:
Divulgação/OpenAI
Divulgação/OpenAI

A OpenAI lançou seu novo modelo de inteligência artificial, o1, que promete resolver problemas complexos, como codificação e questões matemáticas, de forma mais eficaz. O modelo é o primeiro de uma série planejada pela empresa para aprimorar as habilidades de "raciocínio" em IAs, sendo também disponibilizado em uma versão menor e mais acessível, o1-mini.

O modelo o1 é nome oficial do projeto conhecido anteriormente como Strawberry e Q* (Q Star), que circulava entre rumores há alguns meses.

O modelo o1 da OpenAI

Canaltech
O Canaltech está no WhatsApp!Entre no canal e acompanhe notícias e dicas de tecnologia
Continua após a publicidade

O lançamento do o1 é visto pela OpenAI como um passo em direção à criação de IAs com capacidades mais semelhantes às humanas. Segundo a empresa, o modelo é mais eficiente na escrita de códigos e na resolução de problemas multietapas em comparação aos modelos anteriores.

"A família de modelos de linguagem o1 é treinada com aprendizado por reforço para executar raciocínios complexos. O o1 pensa antes de responder — ele pode produzir uma longa cadeia de pensamento antes de responder ao usuário", destaca a OpenAI na documentação do modelo.

O acesso ao o1 já está liberado para usuários do ChatGPT Plus e Team, enquanto os assinantes Enterprise e Edu terão acesso na próxima semana. A versão mini do modelo, mais acessível, estará disponível para os usuários gratuitos, mas a data de lançamento ainda não foi definida. Na API, o custo para desenvolvedores é de US$ 15 por 1 milhão de tokens de entrada e US$ 60 por 1 milhão de tokens de saída, valores significativamente maiores que os do GPT-4.

IA "pensa" antes de responder

O diferencial do o1 está em seu processo de treinamento, que usa uma técnica chamada aprendizado por reforço, na qual o sistema recebe recompensas ou penalidades para aprender a resolver problemas de maneira autônoma. Essa abordagem permite que o modelo use um “fluxo de pensamento”, semelhante ao processo humano de raciocínio passo a passo.

Segundo a companhia, "essas capacidades avançadas de raciocínio abrem novos caminhos para melhorar a segurança e a robustez de nossos modelos. Em particular, nossos modelos podem raciocinar sobre nossas políticas de segurança em contexto ao responder a prompts potencialmente inseguros”.

“Também descobrimos que as capacidades de raciocínio aprimoradas levam a um melhor desempenho do modelo. Isso indica que treinar modelos para incorporar uma cadeia de pensamento antes de responder tem o potencial de desbloquear benefícios substanciais, ao mesmo tempo que aumenta alguns riscos decorrentes de inteligência aumentada”, explica a companhia na documentação do o1.

Continua após a publicidade

Mesmo com melhorias na precisão, a OpenAI admite que o modelo ainda enfrenta desafios, como a questão das alucinações. Em testes internos, “o1-preview alucinou com menos frequência do que GPT-4o, e o1-mini menos do que GPT-4o-mini. No entanto, recebemos feedbacks informais de que o1-preview e o1-mini tendem a alucinar mais do que GPT-4o e GPT-4o-mini”, informou a companhia reconhecendo que mais trabalho será necessário para entender “holisticamente” as alucinações dos modelos.

Além disso, o o1 não supera o GPT-4o em certos aspectos, como o conhecimento factual sobre o mundo e a capacidade de navegação na web. A empresa, no entanto, acredita que o modelo marca o início de uma nova fase para as IAs, com foco em tarefas complexas.

Leia mais sobre a OpenAI: