Discourse AI - Verwandte Themen

:bookmark: Dieser Leitfaden erklärt, wie Sie die Funktion „Verwandte Themen“ des Discourse AI-Plugins aktivieren und konfigurieren.

:person_raising_hand: Erforderliches Benutzerniveau: Administrator

Verwandte Themen helfen Benutzern, relevante Inhalte zu entdecken, indem sie semantisch ähnliche Themen vorschlagen, die auf dem aktuell gelesenen Thema basieren. Dies verbessert die Inhaltserkundung und erhöht das Benutzerengagement.

Funktionen

  • Semantische Textähnlichkeit: Geht über den Schlüsselwortabgleich hinaus, um wirklich verwandte Inhalte zu finden
  • Umschalten zwischen „Vorgeschlagenen“ und „Verwandten“ Themen
  • Verfügbar für anonyme und angemeldete Benutzer

Verwandte Themen aktivieren

:information_source: Verwandte Themen sind standardmäßig für alle Discourse-gehosteten Kunden mit aktiviertem Discourse AI-Plugin eingeschaltet.

Voraussetzungen

Verwandte Themen erfordern Embeddings, um zu funktionieren.

Wenn Sie bei uns gehostet werden, werden Embeddings mithilfe eines Open-Source-Modells bereitgestellt. Es ist keine zusätzliche Einrichtung erforderlich.
Selbst gehostete Instanzen müssen ihre eigenen Embeddings über einen Drittanbieter bereitstellen.

Konfiguration

  1. Gehen Sie zu Admin → Einstellungen → Plugins
  2. Suchen Sie nach „discourse-ai“ und stellen Sie sicher, dass es aktiviert ist
  3. Aktivieren Sie ai_embeddings_enabled, um Embeddings zu aktivieren
  4. Aktivieren Sie ai_embeddings_semantic_related_topics_enabled, um die Funktion „Verwandte Themen“ zu aktivieren

Zusätzliche Konfiguration

Abhängig von Ihrer Einrichtung müssen Sie möglicherweise die folgenden Einstellungen anpassen:

  • Für nicht-englische Websites (Discourse-gehostet oder selbst gehostet mit eigenem Modell):
    Setzen Sie ai embeddings model auf multilingual-e5-large
  • Für Cloudflare Workers AI:
    Setzen Sie ai embeddings model auf bge-large-en
  • Für OpenAI oder Azure OpenAI:
    Setzen Sie ai embeddings model auf text-embedding-ada-002

Technisches FAQ

Diagramm der Architektur von Verwandten Themen anzeigen

Der Überblick ist, dass beim Erstellen/Aktualisieren eines Themas Folgendes passiert:

sequenceDiagram
    User->>Discourse: Erstellt Thema
    Discourse-->>Embedding Microservice: Generiert Embeddings
    Embedding Microservice-->>Discourse:
    Discourse-->>PostgreSQL: Speichert Embeddings

Und während des Besuchs eines Themas:

sequenceDiagram
    User->>Discourse: Besucht Thema
    Discourse-->>PostgreSQL: Fragt nach nächsten Themen
    PostgreSQL-->>Discourse:
    Discourse->>User: Präsentiert verwandte Themen

Wie funktionieren Verwandte Themen?

  • Wenn ein Benutzer ein Thema besucht, fragt Discourse die Datenbank nach den semantisch ähnlichsten Themen, basierend auf deren eingebetteten Darstellungen. Diese verwandten Themen werden dann dem Benutzer präsentiert, was zu einer weiteren Erkundung der Inhalte der Community anregt.

Wie werden Themen-/Postdaten verarbeitet?

  • Bei Discourse-gehosteten Websites werden Daten in unserem sicheren virtuellen privaten Rechenzentrum verarbeitet. Bei selbst gehosteten Websites hängt die Datenverarbeitung von Ihrem gewählten Drittanbieter ab.

Wo werden die Embeddings-Daten gespeichert?

  • Embeddings-Daten werden in Ihrer Discourse-Datenbank gespeichert, zusammen mit anderen Forendaten wie Themen, Beiträgen und Benutzern.

Welches semantische Modell wird verwendet und wie wurde es trainiert?

  • Auf Discourse gehostete Websites verwenden standardmäßig das all-mpnet-base-v2 Modell. Dieses Modell eignet sich gut für Nischen- und allgemeine Communities. Selbst gehostete Websites können je nach gewähltem Anbieter unterschiedliche Modelle verwenden.
14 „Gefällt mir“

Etwas, das man im Auge behalten sollte.

Bei der Überprüfung vieler Beiträge in verwandten Themen für eine englische Website (OpenAI) stelle ich fest, dass spanische Themen tendenziell zusammengefasst werden, und vermute, dass, wenn sie zuerst ins Englische übersetzt würden, jeder Beitrag einen anderen Vektor hätte und somit mit anderen Beiträgen gruppiert würde. :slightly_smiling_face:



Ein Nebeneffekt dieser Funktion für Moderatoren ist die Überprüfung, ob die Kategorien der in verwandten Themen aufgeführten Beiträge korrekt sind.

Wenn ich jeden neuen Beitrag überprüfe, überprüfe ich auch die verwandten Themen. Dies wird zu einer effektiven Methode, um Themen zu identifizieren, die mit der falschen Kategorie erstellt wurden.

FYI - Eine verwandte Idee wurde in dieser Funktionsanfrage festgestellt.



Dieses Thema finden, wenn man oft den folgenden Link benötigt, der nicht so leicht zu finden ist, also hier vermerkt.

2 „Gefällt mir“

Dieses Verhalten wird vom Modell gesteuert und scheint ein bekanntes Problem zu sein:

Ich denke, das von uns empfohlene OSS-Modell für mehrsprachige Websites leistet hier bessere Arbeit, aber wir müssen es noch bei mehr Kunden einführen, um dies zu validieren.

2 „Gefällt mir“

Ich kann diese Option nicht aktivieren:

Fehlt mir hier etwas oder reicht Gemini allein nicht aus?

UPDATE: Die Anweisungen und die Fehlerbeschreibung sollten aktualisiert werden, um hinzuzufügen, dass das ai embeddings model auch aktualisiert werden sollte, um mit dem Anbieter übereinzustimmen, andernfalls kann ai_embeddings_enabled nicht aktiviert werden. In der Parameterbeschreibung fehlt Gemini als Option.

1 „Gefällt mir“

7 Beiträge wurden in ein neues Thema aufgeteilt: "Net::HTTPBadResponse" Fehler bei Gemini Embeddings

Was soll ich hier eingeben, bitte:\n\n

\n\nIch möchte das obige Feld ausfüllen, weil ich die erste der 4 unten gezeigten Optionen aktivieren möchte:\n

Wenn Sie OpenAI verwenden, nichts.

1 „Gefällt mir“

Dann bereitet mir diese erste Option (Embeddings-Modul) Sorgen, ich kann sie nicht aktivieren:

Die meisten davon sind leer. Aber ai embeddings discourse service api key ist Ihr OpenAI API und ai embeddings discourse service api endpoint ist https://api.openai.com/v1/embeddings. Das Modell sollte text-embedding-3-large sein (sicher, es kann auch small sein, aber das hat einige Probleme).

1 „Gefällt mir“

3 Beiträge wurden in ein neues Thema aufgeteilt: Wie man sowohl vorgeschlagene als auch verwandte Themen anzeigen lässt

Welche Ergebnisse hattest du beim Vergleich von small und large? Ich weiß, dass es einen Unterschied in den Dimensionen gibt, der die Präzision des Modells beeinflusst. Die small-Version ist 5x günstiger. Ist sie in der realen Welt für die Themenähnlichkeit wirklich unbrauchbar? Unser Forum ist zu 99 % auf Englisch.

Ich wäre sehr daran interessiert, mehr zu erfahren. Können Sie bitte näher erläutern, wo all-mpnet-base-v2 im Vergleich zu OpenAI-Modellen für eine rein englische Website steht?

Embeddings sind so günstig, dass der Preis keine Rolle spielt – es sei denn, es gibt unzählige Beiträge, bei denen 0,01 Cent Gesamtkosten ausmachen.

Aber ehrlich gesagt… ich habe keine Unterschiede gesehen. Und für mich, da die Chance besteht, dass ich RAG und Embeds nicht richtig nutzen kann, sind beide gleichermaßen nutzlos. Ich weiß, das widerspricht der öffentlichen Meinung, aber auf meiner Website findet und nutzt dieses System einfach nichts Nützliches.

Wahrscheinlich liegt es an den OpenAI-Modellen, aber ich habe nicht genug Geld, um diese professionelleren Lösungen zu nutzen.

1 „Gefällt mir“

Ich habe bisher das Modell text-embedding-3-small verwendet, bevor ich das hier gelesen habe. Ist text-embedding-ada-002 viel besser?

Ada ist die vorherige Generation

1 „Gefällt mir“