Discourse AI - AI検索

:bookmark: このガイドでは、Discourse AI プラグインの一部である AI 検索機能を有効化および設定する方法について説明します。
:person_raising_hand: 必要なユーザーレベル:管理者

関連トピックと同様に、AI 検索は、従来の検索で使用される厳密なキーワード一致を超えた、意味的なテキスト類似性を使用して最も関連性の高いトピックを見つけるのに役立ちます。これにより、厳密には一致しないが、元の検索に関連性のあるトピックを発見できます。探しているものが見つからない場合は、AI 検索がお手伝いします!

機能

  • 意味的なテキスト類似性:キーワードの一致だけでなく、意味解析を使用してテキストの類似性を見つけます。
  • AI クイック検索
  • フルページ検索での AI 検索のオン/オフ切り替え
  • :sparkles: アイコンで示される結果
  • 匿名ユーザーとログイン済みユーザーの両方に適用可能

AI 検索の有効化

前提条件

AI 検索を使用するには、Embeddings と大規模言語モデル (LLM) が必要です。

Embeddings

ホスティングをご利用の場合、デフォルトのオプションを提供します。セルフホスティングの場合は、Discourse AI - Embeddings のガイドに従ってください。

大規模言語モデル (LLM)

Discourse ホスティングのお客様およびセルフホスティングのお客様は、プロバイダーから少なくとも 1 つの大規模言語モデル (LLM) を設定する必要があります。

開始するには、Discourse AI - Large Language Model (LLM) settings page から設定できます。

設定

  1. 管理設定 → プラグイン に移動し、discourse-ai を検索または見つけて、有効になっていることを確認します。
  2. Embeddings の場合は ai_embeddings_enabled を有効にします。
  3. AI 検索を有効にするには ai_embeddings_semantic_search_enabled を有効にします。

技術 FAQ

[AI 検索ロジックの概要を展開 ]

mermaid height=255,auto
sequenceDiagram
    User->>+Discourse: 「ゲーミフィケーション」を検索
    Discourse->>+LLM: 「Discourse、オープンソースのインターネットフォーラムシステム」に関するフォーラムで「ゲーミフィケーション」の記事を作成
    LLM->>+Discourse: ゲーミフィケーションには、ポイント、バッジ、レベル、リーダーボードなどのゲームデザイン要素を非ゲームコンテキストに適用することが含まれます...
    Discourse->>+EmbeddingsAPI: 「ゲーミフィケーションには、ゲームデザインを適用することが含まれます...」の埋め込みを作成
    EmbeddingsAPI->>+Discourse: [0.123, -0.321...]
    Discourse->>+PostgreSQL: [0.123, -0.321...] に最も近いトピックを教えてください
    PostgreSQL->>+Discourse: トピック:[1, 5, 10, 50]
    Discourse->>+User: トピック:[1, 5, 10, 50]

AI 検索はどのように機能しますか?

  • 最初の検索クエリは LLM を介して実行され、仮説的なトピック/投稿が作成されます。その後、その投稿に対して Embeddings が実行され、検索クエリと類似した一致がサイト内で検索されます。最後に、Reciprocal Rank Fusion (RFF) を使用して、通常の検索と一致するように上位の結果を再ランク付けします。

トピック/投稿データはどのように処理されますか?

  • LLM データはサードパーティプロバイダーによって処理されます。詳細については、特定のプロバイダーを参照してください。デフォルトでは、Embeddings マイクロサービスは、既存のフォーラムをホストする他のサーバーと並行して実行されます。ここにはサードパーティは関与せず、特定の情報は仮想プライベートデータセンター内の内部ネットワークから離れることはありません。

データはどこに保存されますか?

  • LLM プロバイダーによって作成された仮説的なトピック/投稿は、そのドキュメントの Embeddings と共に一時的にキャッシュされます。Embeddings データは、トピック、投稿、ユーザーを保存しているのと同じデータベースに保存されます。そこにもう 1 つのデータテーブルがあります。

Embeddings の「セマンティックモデル」はどのようなものですか?どのように「トレーニング」されましたか?また、それが私たちの「専門的な」コミュニティのトピックに正確に適用できるかどうかをテストする方法はありますか?

  • デフォルトでは、このようなオープンソースモデルなどの事前トレーニング済みモデルを使用します。多くの顧客に展開しており、ニッチなコミュニティと一般的なコミュニティの両方でうまく機能することがわかりました。パフォーマンスがユースケースに十分でない場合は、より複雑なモデルを用意していますが、経験上、デフォルトのオプションは堅実な選択です。
「いいね!」 6

ai embeddings semantic search hyde model で軽微な UI バグを見つけました。再現手順は以下の通りです。

  1. AI Discourse プラグインをインストールします。
  2. 設定 → Gemini キーの設定を開きます。
  3. ai embeddings semantic search enabled を有効にします。
  4. ai embeddings semantic search hyde model には「Google - gemini-pro (未構成)」と表示されます。

「未構成」は、すべての設定を有効にしてページを更新するまで消えません。

「いいね!」 2

これはサイト設定ページの制限だと思いますので、申し訳ありません。解決できたとのこと、よかったです。

「いいね!」 1

セマンティクスに関する質問です。一部のAIモジュールでは Gemini の使用が参照され、他のモジュールでは Gemini-Pro の使用が参照されています。これらは異なるモデル(Gemini Nano、Pro、Ultra)を指しているのでしょうか、それとも同じLLMを指しているのでしょうか?もしそうであれば、Gemini自体は何を指し、Geminiの有料または無料サブスクリプションを持っているかどうかは関係ありますか?

「いいね!」 1

ご指摘の通り、Geminiには様々なモデルがあります。お持ちのモデル(現在は無料のProモデルである可能性が高いです)に応じて、関連する設定にAPIキーを挿入するだけです。設定は、お持ちのGeminiモデル用です。

これはあなた次第であり、Geminiをどのように使用したいかによりますが、どちらでも機能するはずです。

詳細はこちらをご覧ください。

「いいね!」 1

LLM への初期プロンプトに何かを注入したり、通常の検索に渡される前に埋め込みを操作したりする方法はありますか?

スタッフの応答(より権威のあるもの)とコミュニティの応答をブースト(または分割)しようとしています。

「いいね!」 2

現在、AI Search 内でのカスタム LLM プロンプトの注入はサポートされていませんが、将来的には追加される可能性があります。

Feature request をお勧めします!

「いいね!」 2

AI検索を使い始めたばかりで、今のところ気に入っています。常にそれを使用しない理由が見つかりません。CSSを使用して.fps-resultを非表示にし、.ai-resultを非表示にしない以外に、AIの結果のみを表示する方法はありますか?

また、クイック検索はどこで見つけられるか詳しく教えていただけますか?

「いいね!」 1

これは一時的にMetaでのみ実験的に利用可能でした。OPから削除しました。ご指摘ありがとうございます。

ヘッダーのオートコンプリート検索には Discourse Algolia Search を使用しています。Discourse AI - AI search を引き続き使用することはできますか?

投稿が新しいトピックに分割されました:Discourse AI のユーザー設定パネルが表示されない