Assistente de IA tendo muitas alucinações ao explicar algo

Não consigo identificar quando o assistente de IA começou a alucinar (ou seja, não sabe e começa a ser… criativo) porque tive outras coisas para fazer nas últimas três semanas, mas hoje a função de explicação tem sido totalmente inútil.

Eu a usei muito antes para explicar termos e expressões aos leitores e, para mim, tem sido a coisa mais valiosa que o assistente de IA pode oferecer [1]. Claro, tem a tendência de encontrar contexto no próprio post, mas essa quantidade de alucinação é demais.

Vem do prompting e/ou do modelo. Sou cliente da OpenAI e não acho que terei vontade de mudar, porque então precisarei editar todos os prompts também. Um modelo auto-hospedado não é uma opção, sou pobre demais para isso.

Então, quais são minhas opções realistas agora? Parar de usá-lo?

Editar

Usei o 4.o-mini e o mudei para o 4.1-mini. Obtive melhores respostas, mas… o conhecimento comum é bastante — “capped” é a palavra certa? Deveria usar o Google ou algo mais, mas então deveria haver a capacidade de editar o prompting, e isso não será uma opção, se eu entendi corretamente as discussões anteriores sobre prompting. Então, minha única opção é mudar para um modelo mais caro, se eu ficasse com a OpenAI?


  1. Eu gostaria de oferecer essa opção aos meus usuários também, mas sei que é realmente difícil, porque agora precisa da capacidade de editar posts publicados. Se pudesse atuar no composer, seria uma verdadeira mudança de jogo ↩︎

1 curtida

Estamos a poucas semanas de permitir que você conecte um helper a uma persona dedicada, nesse ponto você poderá experimentar com engenharia de prompt para ver se consegue fazer com que os modelos mais baratos se comportem como você deseja.

No entanto, recomendo experimentar o Gemini Flash 2.5, ele é muito barato (e tem até um nível gratuito) e deve superar o 4.1 mini.

1 curtida

Ontem ambos os Resumidores começaram a usar apenas inglês no meu fórum. Mas como eu podia editar os prompts, foi fácil consertar para um fórum monolíngue. Nesse caso, o próprio prompting parecia totalmente correto, e eu também usaria uma redação genérica, mas o modelo preguiçoso da OpenAI seguiu o caminho mais fácil :man_shrugging:

This topic was automatically closed 30 days after the last reply. New replies are no longer allowed.