Explorando Opções de Reranking para IA de Discurso

tpetrov · Setembro 16, 2025, 5:54am

Ah, entendi agora, obrigado pela explicação, era isso que estava faltando.

A propósito, sei que muitas vezes há reclassificação em RAG mais avançado. Existe algo como reclassificação em como o Discourse lida com isso? Você acha que adicionar uma etapa de reclassificação teria algum efeito positivo?

sam · Setembro 16, 2025, 6:08am

A reclassificação é um trabalho em andamento.

@Falco / @Roman implementou um reclassificador básico no discourse:

github.com/discourse/discourse

plugins/discourse-ai/config/settings.yml

f9424a549


      
          ai_hugging_face_tei_reranker_endpoint:
            default: ""
          ai_hugging_face_tei_reranker_endpoint_srv:
            default: ""
            hidden: true
          ai_hugging_face_tei_reranker_api_key: ""

Isso é usado em busca semântica e RAG. No entanto, é bastante oculto e não é fácil de configurar.

Acho que o plano de médio prazo aqui (que discutimos com @awesomerobot) foi passar da terminologia de LLM para Modelos… e talvez fazer um pouco de unificação de UI para que você possa definir embeddings/reclassificadores e LLMs em uma única interface.

Por enquanto, suportamos apenas uma API de reclassificador hugging face muito específica.

Certamente melhora a qualidade dos resultados.

tpetrov · Setembro 16, 2025, 6:24am

Incrível!
Então, atualmente, isso está desativado por padrão e não pode ser configurado facilmente em um plano hospedado (pro)?

sam · Setembro 16, 2025, 6:25am

Não tenho certeza, vamos esperar o @Falco responder.

tpetrov · Outubro 2, 2025, 12:19pm

Olá @Falco,

há alguma maneira de habilitar o reranker para testes ou talvez um cronograma?

Falco · Outubro 15, 2025, 4:16pm

Acabamos de implantar uma grande melhoria na tecnologia subjacente que impulsiona a pesquisa semântica no Discourse em DEV: Re-introduce PG Vector 0.8.0 upgrade by romanrizzi · Pull Request #35233 · discourse/discourse · GitHub.

Você pode tentar seu caso de uso novamente agora, já está implantado em seu site. Minha expectativa é que isso melhore o RAG sem a necessidade de um reranker.

Ainda queremos tornar o reranker amplamente disponível, mas estamos aguardando algumas alterações upstream antes.

tpetrov · Outubro 16, 2025, 3:59pm

Obrigado, Falco!

Isso funcionará apenas para a pesquisa semântica em tópicos do Discourse, ou também para documentos RAG carregados em uma persona? Pela minha própria experiência, a IA funciona muito bem com tópicos de fórum (ou seja, no ask.discourse), mas não tão bem com documentos carregados em uma persona (ou ainda não encontrei a melhor fórmula).

Falco · Outubro 16, 2025, 4:16pm

Isso afeta todos os usos de embeddings no Discourse, incluindo Tópicos Relacionados, RAG, Pesquisa, sugestões de categorias e tags do Composer, etc.

Falco · Outubro 30, 2025, 9:50pm

Ei @tpetrov, os resultados melhoraram com o novo modelo de embeddings?

tpetrov · Outubro 31, 2025, 10:33am

Ei Falco, desculpe, não tive tempo de testar extensivamente, então não posso dizer realmente.

Acho que não há como alternar entre os dois para comparar?

Falco · Novembro 2, 2025, 5:06pm

Não agora, os modelos antigo e novo ficaram disponíveis por alguns meses, mas recentemente aposentamos os antigos em nossa hospedagem.

Tópico		Respostas	Visualizações
Discourse AI and retrieval augmented generation Feature ai	3	781	29 de Abril de 2024
RAG capacities of discourse-ai Support ai	7	320	19 de Setembro de 2024
Why is my AI forum helper struggling to answer questions? Support ai , ai-bot	4	343	15 de Outubro de 2025
Advice on a support bot for a technical support forum (Discourse AI vs Discourse Chatbot) General ai-bot , ai	50	3865	19 de Setembro de 2024
Improving quality of search filters in Discourse AI Support ai	14	631	28 de Junho de 2024

Explorando Opções de Reranking para IA de Discurso

Tópicos relacionados