Ce guide explique comment activer et configurer la fonctionnalité Sujets similaires du plugin Discourse AI.
Niveau d’utilisateur requis : Administrateur
Les Sujets similaires aident les utilisateurs à découvrir du contenu pertinent en suggérant des sujets sémantiquement similaires à celui qu’ils sont en train de lire. Cela améliore l’exploration du contenu et augmente l’engagement des utilisateurs.
Fonctionnalités
- Similarité textuelle sémantique : Va au-delà de la correspondance par mot-clé pour trouver du contenu véritablement connexe
- Basculez entre les sujets « Suggérés » et « Similaires »
- Disponible pour les utilisateurs anonymes et connectés
Activation des Sujets similaires
Les Sujets similaires sont activés par défaut pour tous les clients hébergés par Discourse disposant du plugin Discourse AI activé.
Prérequis
Les Sujets similaires nécessitent le fonctionnement des Embeddings.
Si vous êtes sur notre hébergement, les Embeddings sont fournis à l’aide d’un modèle open-source. Aucune configuration supplémentaire n’est requise.
Les instances auto-hébergées devront configurer un modèle d’embedding via un fournisseur pris en charge.
Configuration
- Accédez à Administration → Plugins → Discourse AI → Fonctionnalités IA
- Trouvez le module Embeddings et configurez-le :
- Définissez
ai_embeddings_selected_modelsur une définition d’embedding que vous avez configurée - Activez
ai_embeddings_enabledpour activer les Embeddings
- Définissez
- Activez
ai_embeddings_semantic_related_topics_enabledpour activer la fonctionnalité Sujets similaires
Configuration d’un modèle d’embedding
Avant d’activer les embeddings, vous devez configurer un modèle d’embedding. Accédez à Administration → Plugins → Discourse AI → Embeddings pour créer une nouvelle définition d’embedding. Vous pouvez choisir parmi plusieurs préréglages :
- Open AI :
text-embedding-3-smalloutext-embedding-3-large(recommandé pour la plupart des sites) - Google :
gemini-embedding-001 - Hugging Face (inférence auto-hébergée) :
multilingual-e5-large(recommandé pour les sites non anglais ou multilingues),bge-large-en, oubge-m3
Vous devrez fournir une clé API (ou lier un Secret IA) et une URL de point de terminaison pour le fournisseur que vous avez choisi.
Paramètres supplémentaires
Les paramètres suivants vous permettent d’affiner la fonctionnalité Sujets similaires :
ai_embeddings_semantic_related_topics: Nombre maximum de sujets à afficher dans la section des sujets similaires (par défaut : 5)ai_embeddings_semantic_related_include_closed_topics: Indique s’il faut inclure les sujets fermés dans les résultats similaires (par défaut : true)ai_embeddings_semantic_related_age_penalty: Applique une pénalité aux sujets plus anciens afin que le contenu plus récent soit préféré (par défaut : 0.0, plage : 0.0–2.0)ai_embeddings_semantic_related_age_time_scale: Échelle de temps en jours pour la pénalité d’âge (par défaut : 365)
FAQ Technique
Développer pour voir un diagramme de l'architecture des Sujets similaires
L’aperçu est que lorsqu’un sujet est créé/mis à jour, ceci se produit :
sequenceDiagram
User->>Discourse: Crée un sujet
Discourse-->>Embedding Microservice: Génère des embeddings
Embedding Microservice-->>Discourse:
Discourse-->>PostgreSQL: Stocke les Embeddings
Et lors de la visite du sujet :
sequenceDiagram
User->>Discourse: Visite un sujet
Discourse-->>PostgreSQL: Interroge les sujets les plus proches
PostgreSQL-->>Discourse:
Discourse->>User: Présente les sujets similaires
Comment fonctionnent les Sujets similaires ?
- Lorsqu’un utilisateur visite un sujet, Discourse interroge la base de données pour trouver les sujets les plus sémantiquement similaires en fonction de leurs représentations intégrées (embeddings). Ces sujets similaires sont ensuite présentés à l’utilisateur, encourageant une exploration plus approfondie du contenu de la communauté.
Comment les données des sujets/publications sont-elles traitées ?
- Pour les sites hébergés par Discourse, les données sont traitées dans notre centre de données privé virtuel sécurisé. Pour les sites auto-hébergés, le traitement des données dépend du fournisseur tiers que vous avez choisi.
Où sont stockées les données d’embeddings ?
- Les données d’embeddings sont stockées dans votre base de données Discourse, aux côtés d’autres données de forum telles que les sujets, les publications et les utilisateurs.
Quels modèles d’embedding sont disponibles ?
- Discourse AI prend en charge les modèles d’OpenAI (
text-embedding-3-small,text-embedding-3-large), de Google (gemini-embedding-001), les points de terminaison compatibles avec Hugging Face (bge-large-en,bge-m3,multilingual-e5-large), et Cloudflare Workers AI. Vous pouvez également configurer des modèles d’embedding personnalisés via l’interface d’administration.