Explorando Opções de Reranking para IA de Discurso

Ah, entendi agora, obrigado pela explicação, era isso que estava faltando.

A propósito, sei que muitas vezes há reclassificação em RAG mais avançado. Existe algo como reclassificação em como o Discourse lida com isso? Você acha que adicionar uma etapa de reclassificação teria algum efeito positivo?

A reclassificação é um trabalho em andamento.

@Falco / @Roman implementou um reclassificador básico no discourse:

Isso é usado em busca semântica e RAG. No entanto, é bastante oculto e não é fácil de configurar.

Acho que o plano de médio prazo aqui (que discutimos com @awesomerobot) foi passar da terminologia de LLM para Modelos… e talvez fazer um pouco de unificação de UI para que você possa definir embeddings/reclassificadores e LLMs em uma única interface.

Por enquanto, suportamos apenas uma API de reclassificador hugging face muito específica.

Certamente melhora a qualidade dos resultados.

1 curtida

Incrível!
Então, atualmente, isso está desativado por padrão e não pode ser configurado facilmente em um plano hospedado (pro)?

Não tenho certeza, vamos esperar o @Falco responder.

1 curtida

Olá @Falco,

há alguma maneira de habilitar o reranker para testes ou talvez um cronograma?

Acabamos de implantar uma grande melhoria na tecnologia subjacente que impulsiona a pesquisa semântica no Discourse em DEV: Re-introduce PG Vector 0.8.0 upgrade by romanrizzi · Pull Request #35233 · discourse/discourse · GitHub.

Você pode tentar seu caso de uso novamente agora, já está implantado em seu site. Minha expectativa é que isso melhore o RAG sem a necessidade de um reranker.

Ainda queremos tornar o reranker amplamente disponível, mas estamos aguardando algumas alterações upstream antes.

2 curtidas

Obrigado, Falco!

Isso funcionará apenas para a pesquisa semântica em tópicos do Discourse, ou também para documentos RAG carregados em uma persona? Pela minha própria experiência, a IA funciona muito bem com tópicos de fórum (ou seja, no ask.discourse), mas não tão bem com documentos carregados em uma persona (ou ainda não encontrei a melhor fórmula).

1 curtida

Isso afeta todos os usos de embeddings no Discourse, incluindo Tópicos Relacionados, RAG, Pesquisa, sugestões de categorias e tags do Composer, etc.

1 curtida

Ei @tpetrov, os resultados melhoraram com o novo modelo de embeddings?

1 curtida

Ei Falco, desculpe, não tive tempo de testar extensivamente, então não posso dizer realmente.

Acho que não há como alternar entre os dois para comparar?

1 curtida

Não agora, os modelos antigo e novo ficaram disponíveis por alguns meses, mas recentemente aposentamos os antigos em nossa hospedagem.

1 curtida