Explorer les options de rerangage pour l'IA de discours

Oh, je vois maintenant, merci pour l’explication, c’est ce qui me manquait.

Au fait, je sais qu’il y a souvent un réordonnancement dans les RAG plus avancés. Y a-t-il quelque chose comme un réordonnancement dans la façon dont Discourse le gère ? Pensez-vous qu’ajouter une étape de réordonnancement aurait un effet positif ?

Le reranking est en cours.

@Falco / @Roman a implémenté un reranker de base dans discourse :

Ceci est utilisé dans la recherche sémantique et RAG. Cependant, il est assez caché et pas facile à configurer.

Je pense que le plan à moyen terme ici (dont nous avons discuté avec @awesomerobot) était de passer de la terminologie LLM à Models… et peut-être de faire un peu d’unification de l’interface utilisateur afin que vous puissiez définir les embeddings/rerankers et les LLM dans une seule interface.

Pour l’instant, nous ne prenons en charge qu’une API de reranker hugging face très spécifique.

Cela améliore certainement la qualité des résultats.

1 « J'aime »

Génial !
Donc, actuellement, c’est désactivé par défaut et ne peut pas être facilement configuré sur un plan hébergé (pro) ?

Pas sûr, attendons que @Falco réponde.

1 « J'aime »

Salut @Falco
Y a-t-il un moyen d’activer le reranker pour les tests ou une chronologie ?

Nous venons de déployer une amélioration majeure de la technologie sous-jacente qui alimente la recherche sémantique dans Discourse sur DEV: Re-introduce PG Vector 0.8.0 upgrade by romanrizzi · Pull Request #35233 · discourse/discourse · GitHub.

Pouvez-vous réessayer votre cas d’utilisation maintenant, c’est déjà déployé sur votre site. Je m’attends à ce que cela améliore le RAG sans avoir besoin d’un réordonnanceur.

Nous voulons toujours rendre le réordonnanceur largement disponible, mais nous attendons que certains changements en amont soient intégrés.

2 « J'aime »

Merci Falco !

Est-ce que cela fonctionnera uniquement pour la recherche sémantique sur les sujets Discourse, ou aussi pour les documents RAG téléchargés sur une persona ? D’après ma propre expérience, l’IA fonctionne assez bien avec les sujets de forum (c’est-à-dire sur ask.discourse), mais pas aussi bien avec les documents téléchargés sur une persona (ou je n’ai pas encore trouvé la meilleure formule).

1 « J'aime »

Cela affecte toutes les utilisations des embeddings dans Discourse, y compris les sujets connexes, le RAG, la recherche, les suggestions de catégories et de tags dans le compositeur, etc.

1 « J'aime »

Salut @tpetrov, les résultats se sont-ils améliorés avec le nouveau modèle d’intégration ?

1 « J'aime »

Salut Falco, désolé, je n’ai pas eu le temps de tester de manière approfondie, donc je ne peux pas vraiment dire.

Je suppose qu’il n’y a aucun moyen de passer de l’un à l’autre pour comparer ?

1 « J'aime »

Pas maintenant, les anciens et les nouveaux modèles étaient disponibles pendant quelques mois, mais nous avons récemment retiré les anciens de notre hébergement.

1 « J'aime »