IA que raciocina mais alucina mais: novos modelos da OpenAI “viajam” bastante

Apesar de serem considerados modelos de inteligência artificial (IA) de última geração, o o3 e o o4-mini, lançados recentemente pela OpenAI, estão enfrentando um problema peculiar: eles inventam muitas coisas (alucinam). E o pior, fazem isso mais do que seus antecessores.

As chamadas “alucinações” são um dos maiores desafios na evolução da IA. Elas acontecem quando os modelos geram informações falsas ou inventadas, mesmo quando parecem confiantes em suas respostas. Historicamente, cada nova versão melhorava nesse aspecto, alucinando menos. Mas, surpreendentemente, o o3 e o o4-mini estão indo na direção oposta.

Alucinação preocupante

Testes da OpenAI revelaram que o o3 alucina em 33% das vezes ao responder perguntas sobre pessoas no PersonQA, o benchmark interno da startup. Já o o4-mini foi ainda pior, “viajando” 48% da vezes. Para comparação, modelos anteriores como o o1 e o o3-mini tinham taxas de erro de apenas 16% e 14,8%, respectivamente.

Pesquisadores independentes também notaram comportamentos estranhos. Em testes do Transluce, um laboratório de pesquisa de IA sem fins lucrativos, o o3 afirmou executar código em um MacBook Pro 2021 fora do ChatGPT, algo que ele não pode fazer. Além disso, usuários relataram links quebrados fornecidos pelo modelo em tarefas de codificação. Esses erros podem parecer pequenos, mas têm grande impacto em setores onde a precisão é crucial, como escritórios de advocacia ou empresas de saúde.

Leia também:

Por outro lado, esses modelos continuam impressionando em áreas como matemática e programação. O problema é que, enquanto buscam respostas mais detalhadas e criativas, as chances de inventar informações aumentam. A OpenAI admitiu que ainda não sabe por que isso está acontecendo e reconheceu que encontrar uma solução será essencial para o futuro da IA.

Uma possível saída é permitir que os modelos consultem a internet em tempo real. Testes internos da OpenAI mostram que o GPT-4o com pesquisa na web alcança 90% de precisão em algumas tarefas. No entanto, essa solução levanta questões de privacidade, já que os prompts dos usuários podem ser expostos a terceiros.

Via TechCrunch

O post IA que raciocina mais alucina mais: novos modelos da OpenAI “viajam” bastante apareceu primeiro em Olhar Digital.

gpt_5-1024x683

E o GPT-5? OpenAI surpreende e antecipa dois novos modelos de IA

A OpenAI confirmou uma reviravolta em sua estratégia. Após cancelar o lançamento do modelo de raciocínio o3 em fevereiro, a empresa agora promete disponibilizar dois de uma só vez: o próprio o3 e seu sucessor, o o4-mini, em “algumas semanas”.

A mudança de planos está diretamente ligada ao desenvolvimento do aguardado GPT-5, cujo lançamento foi adiado para os próximos meses.

Nova estratégia da OpenAI

O CEO da OpenAI, Sam Altman, explicou a decisão em uma publicação no X, destacando que a empresa pretende “tornar o GPT-5 muito melhor do que pensávamos originalmente”.

No entanto, a integração de todos os recursos do GPT-5 se mostrou mais complexa do que o previsto, exigindo mais tempo para garantir uma experiência de usuário otimizada. Além disso, a OpenAI busca assegurar capacidade suficiente para atender à “demanda sem precedentes” esperada para o GPT-5.

O que o GPT-5 promete?

  • Quando lançado, o GPT-5 promete ser um modelo unificado, incorporando recursos avançados como voz, Canvas, pesquisa e pesquisa profunda.
  • A OpenAI planeja oferecer diferentes níveis de acesso ao GPT-5, com o chat padrão disponível para todos os usuários, sujeito a limites de abuso.
  • Assinantes do ChatGPT Plus e ChatGPT Pro terão acesso a níveis de inteligência mais elevados, explorando todo o potencial do modelo.
GPT-5 promete ser um modelo unificado, incorporando recursos avançados. (Imagem: Hamara/Shutterstock)

Vale destacar que a OpenAI enfrenta uma crescente pressão de concorrentes como o laboratório chinês de IA DeepSeek, que adota uma abordagem “aberta” ao lançar seus modelos. Essa estratégia contrasta com a da OpenAI, que tradicionalmente mantém seus modelos em sigilo.

Leia mais:

Para responder à concorrência e democratizar o acesso à IA, a OpenAI anunciou que lançará seu primeiro modelo de linguagem aberto desde o GPT-2 nos próximos meses. O modelo, que terá capacidades de raciocínio, passará por rigorosas avaliações de segurança antes de ser disponibilizado.

O post E o GPT-5? OpenAI surpreende e antecipa dois novos modelos de IA apareceu primeiro em Olhar Digital.