Explorer les options de rerangage pour l'IA de discours

tpetrov · Septembre 16, 2025, 5:54

Oh, je vois maintenant, merci pour l’explication, c’est ce qui me manquait.

Au fait, je sais qu’il y a souvent un réordonnancement dans les RAG plus avancés. Y a-t-il quelque chose comme un réordonnancement dans la façon dont Discourse le gère ? Pensez-vous qu’ajouter une étape de réordonnancement aurait un effet positif ?

sam · Septembre 16, 2025, 6:08

Le reranking est en cours.

@Falco / @Roman a implémenté un reranker de base dans discourse :

github.com/discourse/discourse

plugins/discourse-ai/config/settings.yml

f9424a549


      
          ai_hugging_face_tei_reranker_endpoint:
            default: ""
          ai_hugging_face_tei_reranker_endpoint_srv:
            default: ""
            hidden: true
          ai_hugging_face_tei_reranker_api_key: ""

Ceci est utilisé dans la recherche sémantique et RAG. Cependant, il est assez caché et pas facile à configurer.

Je pense que le plan à moyen terme ici (dont nous avons discuté avec @awesomerobot) était de passer de la terminologie LLM à Models… et peut-être de faire un peu d’unification de l’interface utilisateur afin que vous puissiez définir les embeddings/rerankers et les LLM dans une seule interface.

Pour l’instant, nous ne prenons en charge qu’une API de reranker hugging face très spécifique.

Cela améliore certainement la qualité des résultats.

tpetrov · Septembre 16, 2025, 6:24

Génial !
Donc, actuellement, c’est désactivé par défaut et ne peut pas être facilement configuré sur un plan hébergé (pro) ?

sam · Septembre 16, 2025, 6:25

Pas sûr, attendons que @Falco réponde.

tpetrov · Octobre 2, 2025, 12:19

Salut @Falco
Y a-t-il un moyen d’activer le reranker pour les tests ou une chronologie ?

Falco · Octobre 15, 2025, 4:16

Nous venons de déployer une amélioration majeure de la technologie sous-jacente qui alimente la recherche sémantique dans Discourse sur DEV: Re-introduce PG Vector 0.8.0 upgrade by romanrizzi · Pull Request #35233 · discourse/discourse · GitHub.

Pouvez-vous réessayer votre cas d’utilisation maintenant, c’est déjà déployé sur votre site. Je m’attends à ce que cela améliore le RAG sans avoir besoin d’un réordonnanceur.

Nous voulons toujours rendre le réordonnanceur largement disponible, mais nous attendons que certains changements en amont soient intégrés.

tpetrov · Octobre 16, 2025, 3:59

Merci Falco !

Est-ce que cela fonctionnera uniquement pour la recherche sémantique sur les sujets Discourse, ou aussi pour les documents RAG téléchargés sur une persona ? D’après ma propre expérience, l’IA fonctionne assez bien avec les sujets de forum (c’est-à-dire sur ask.discourse), mais pas aussi bien avec les documents téléchargés sur une persona (ou je n’ai pas encore trouvé la meilleure formule).

Falco · Octobre 16, 2025, 4:16

Cela affecte toutes les utilisations des embeddings dans Discourse, y compris les sujets connexes, le RAG, la recherche, les suggestions de catégories et de tags dans le compositeur, etc.

Falco · Octobre 30, 2025, 9:50

Salut @tpetrov, les résultats se sont-ils améliorés avec le nouveau modèle d’intégration ?

tpetrov · Octobre 31, 2025, 10:33

Salut Falco, désolé, je n’ai pas eu le temps de tester de manière approfondie, donc je ne peux pas vraiment dire.

Je suppose qu’il n’y a aucun moyen de passer de l’un à l’autre pour comparer ?

Falco · Novembre 2, 2025, 5:06

Pas maintenant, les anciens et les nouveaux modèles étaient disponibles pendant quelques mois, mais nous avons récemment retiré les anciens de notre hébergement.

Sujet		Réponses	Vues
Discourse AI and retrieval augmented generation Feature ai	3	836	Avril 29, 2024
RAG capacities of discourse-ai Support ai	7	432	Septembre 19, 2024
Why is my AI forum helper struggling to answer questions? Support ai , ai-bot	4	409	Octobre 15, 2025
Advice on a support bot for a technical support forum (Discourse AI vs Discourse Chatbot) General ai , ai-bot	57	4328	Avril 29, 2026
Improving quality of search filters in Discourse AI Support ai	14	693	Juin 28, 2024

Explorer les options de rerangage pour l'IA de discours

Sujets connexes