Há um PR aberto para adicionar o GPT-5, mas algo está dando errado durante a CI.
Abri um tópico Dev sobre isso.
Há um PR aberto para adicionar o GPT-5, mas algo está dando errado durante a CI.
Abri um tópico Dev sobre isso.
Foi mesclado.
Se você achar o raciocínio do GPT-5 muito lento, pode alterar o nível de raciocínio. Agora existe um novo nível minimal.
Obrigado a @NateDhaliwal por sua assistência neste!
Nosso bot estava demorando muito até que definimos o raciocínio como mínimo. Obrigado!
Sinceramente, estou achando o GPT-5 geralmente muito lento e não vale claramente o tempo adicional de resposta.
Como você o achou para o seu bot de suporte?
Eu experimentei o gpt-5 usando o Chat GPT, que é uma coisa realmente muito diferente do que via API, e ele precisa desse longo tempo de raciocínio para dar respostas ligeiramente melhores do que o 4o ou o o1 dariam. Quando ele tem que responder rápido, não é melhor que o 4.1.
Tenho certeza de que a situação é semelhante, ou pior, devido à falta de ferramentas e de prompts, ao usar a API. Mas não sei ao certo, porque o gpt-5 é dolorosamente lento e, em um ambiente de fórum, ele deve responder perto da velocidade da luz.
Em termos de desempenho de conteúdo,Anecdoticamente, parece que o gpt-5 está fornecendo respostas técnicas notavelmente melhores que o gpt-4o. Não tenho certeza de como quantificar isso, mas me impressionou muito.
Estou obtendo resultados variados no tempo de resposta. Parece, a partir de experimentos esta manhã, que o gpt-5 é mais lento em média, mas não muito, e houve alguns casos em que a resposta veio mais rápido com o gpt-5. Estou medindo de 5 segundos a 35 segundos para uma resposta.
Estamos usando RAG e não consigo dizer qual parte da latência vem da pesquisa RAG em vez da conclusão do chat. Pode ser que às vezes ele opte por não fazer a pesquisa RAG, a pesquisa aconteça mais rápido, ou algo esteja em cache (na pesquisa ou na conclusão).
Normalmente escolheríamos respostas melhores em vez de uma resposta mais rápida, porque dar conselhos técnicos ruins aos clientes é caro. Até certo ponto, no entanto, se expirar, essa é uma experiência de usuário muito ruim.
O GPT-5 recomenda principalmente o gpt-5-mini para nosso caso de uso e escala para o gpt-5 em algumas circunstâncias. Parece interessante, mas complicado. Você considerou alternar entre modelos dinamicamente? Por que a OpenAI não faz isso automaticamente? ChatGPT - Compare GPT models performance
Tivemos que voltar para o gpt-4o porque, aparentemente, o gpt-5-mini acha que pode fazer coisas que não pode. Ele se ofereceu com confiança para configurar um serviço de monitoramento de alarmes para um cliente e conectá-lo ao equipamento de alarme de sua casa. Ele pediu os números de ID do equipamento e alucinou como se fosse um concierge configurando tudo para eles. Nosso site pode fazer isso, mas o chatbot não. Ele não parece estar respeitando as barreiras de proteção no prompt do sistema como o gpt-4o fazia. Precisaremos aprimorá-lo antes de podermos permitir que as pessoas o usem.
Atualização: Acontece que o gpt-5 é muito melhor em seguir instruções e respeitar regras no prompt do que o gpt-5-mini. Se você vai deixar um bot representar sua marca, recomendo o gpt-5, embora seja mais lento e 5 vezes mais caro. Há muito risco de o gpt-5-mini sair dos trilhos.
Tenho tido muita sorte com o GTP-5-mini em fluxos agenticos via chamada de ferramentas, escrita de código e dados estruturados. Geralmente acho dados estruturados mais fáceis para aplicativos de IA do que não estruturados! .. não era o que eu esperava! .. mas as salvaguardas são mais fáceis .. (código em loop, humano em loop, llm-como-juiz, etc)
Por favor, assista a isto para um passo a passo de alto desempenho e baixo custo do gpt-5-mini e gpt-4o…
Se alguém estiver interessado em incorporar recursos de dados estruturados no Discourse como um plugin, etc., por favor, entre em contato.
Uma extensão de PNL para sql/estatísticas/ciência de dados para o Data Explorer é um exemplo.. Mas também poderia possivelmente ter uma ferramenta/plugin/recurso que permita consultas em linguagem natural de arquivos olap sqlLite ou duckdb somente leitura carregados no contêiner? Apenas um pensamento.. ![]()
A propósito, adicionei o GPT 5.1 ao plugin, juntamente com algumas correções:
@tom_eric você perguntou sobre a capacidade de jogar com outros membros do fórum em outro Tópico.
Eu tentei este prompt com o Chatbot e parece funcionar com o GPT 5.1, experimente:
@Chatbot facilite um jogo de Go 9x9 com @Other_Player e eu usando uma tabela markdown para renderizar o tabuleiro - deixe-me começar e aceite jogadas apenas de mim e de @Other_Player e somente quando for a nossa vez - renderize o tabuleiro e peça-me para começar…
Ah, obrigado. Essa é uma ideia realmente criativa.Ah, obrigado. Essa é uma ideia realmente criativa.
de nada, me avise como isso funciona ![]()