このトピックでは、Discourse AI プラグインの Embeddings モジュールの設定について説明します。埋め込み(embeddings)とは何か、どのように使用されるか、そしてそれらをセットアップする方法を解説します。
必要なユーザーレベル: 管理者
埋め込みは、Discourse AI プラグインの重要なコンポーネントであり、関連トピック や AI検索 などの機能を可能にします。このガイドでは、Discourse インスタンスでの埋め込みの設定と使用方法を順を追って説明します。
埋め込みとは?
埋め込みは、テキストの意味的意味を捉える数値表現です。Discourse では、これらは以下に使用されます。
- トピックページの最下部に関連記事を生成する
- 意味検索機能(セマンティック検索)を有効にする
埋め込みの設定
ホストされているお客様の場合
ホストされているお客様の場合、埋め込みは事前に設定されています。それらに依存する AI 機能を有効にするだけです。
セルフホスト型インスタンスの場合
セルフホストされている場合は、詳細なセットアップ手順について Discourse AI セルフホストガイド を参照してください。
埋め込み定義の設定
埋め込みモデルは、管理 UI で 埋め込み定義 (Embedding Definitions) として設定されるようになりました。管理 → AI プラグイン → Embeddings タブに移動します。新しい埋め込み定義を追加する際、事前に設定された プリセット (presets) から選択するか、手動で 1 つを設定できます。
利用可能なプリセットには以下が含まれます。
- text-embedding-3-large (OpenAI)
- text-embedding-3-small (OpenAI)
- text-embedding-ada-002 (OpenAI)
- gemini-embedding-001 (Google)
- bge-large-en (Hugging Face)
- bge-m3 (Hugging Face)
- multilingual-e5-large (Hugging Face)
各埋め込み定義には、表示名、プロバイダー、URL、APIキー(またはAIシークレット)、トークナイザー、次元数、距離関数、最大シーケンス長、およびオプションの埋め込み/検索プロンプトが含まれます。
埋め込みの設定
管理 → プラグイン → Discourse AI に移動し、以下の設定が有効になっていることを確認します。
- ai embeddings enabled: 埋め込みモジュールをオンまたはオフにする
- ai embeddings selected model: 埋め込みの生成に使用する埋め込み定義を選択する
調整可能なオプション設定は次のとおりです…
- AI embeddings generate for pms: プライベートメッセージ(PM)に対して埋め込みを生成するかどうかを決定する
- AI embeddings semantic related topics enabled: 「関連記事」機能を有効または無効にする
- AI embeddings semantic related topics: 表示する関連記事の最大数
- AI embeddings semantic related include closed topics: 閉鎖されたトピックを関連記事の結果に含める
- AI embeddings semantic related age penalty: 関連記事の結果のトピックに指数関数的な経過時間のペナルティを適用する(0.0 は無効、値が大きいほど古いトピックがより多くペナルティを受ける)
- AI embeddings semantic related age time scale: 経過時間ペナルティ計算の時間スケール(日数)(デフォルト: 365)
- AI embeddings semantic search enabled: フルページ AI 検索を有効にする
- AI embeddings semantic quick search enabled: 検索メニューのポップアップでセマンティック検索オプションを有効にする
- AI embeddings semantic search use hyde: セマンティック検索のために HyDE(Hypothetical Document Embedding)を有効にする
- AI embeddings semantic search hyde agent: HyDE が有効な場合に検索語を拡張するために使用される AI エージェント
プロバイダー
Discourse AI は複数の埋め込みプロバイダーをサポートしています。
- OpenAI
- Hugging Face(オープンソース/オープンウェイトモデルの場合)
- Cloudflare Workers AI
ホストされているお客様向けに、Discourse はすぐに使用できる事前設定済み(シードされた)埋め込み定義を提供します。
機能
関連記事
有効にすると、トピックページの最下部に「関連記事」セクションが表示され、意味的に類似したディスカッションへのリンクが提供されます。
AI検索
埋め込みは、フルページ検索インターフェイスでのセマンティック検索オプションを強化します。
セマンティック検索では、オプションで HyDE(Hypothetical Document Embedding)を使用できます。ai embeddings semantic search use hyde を介して有効にすると、検索語は ai embeddings semantic search hyde agent で設定された AI エージェントを使用して拡張されます。その後、拡張された検索はベクトルに変換され、類似のトピックを見つけるために使用されます。この手法は検索にわずかな遅延を追加しますが、結果を改善することができます。
HyDE のエージェントを選択する際は、Gemini Flash、Claude Haiku、GPT-4o Mini、または最新の利用可能なモデルなどの高速なモデルを選択してください。
埋め込みの生成
埋め込みは新しい投稿に対して自動的に生成されます。既存のコンテンツに対して埋め込みを生成するには:
- Discourse は、5分ごとに実行されるスケジュールされたジョブを通じて、古いトピックの埋め込みを自動的にバックフィルします。
- バックフィルは、最近のアクティビティ順にトピックを処理します。
FAQ
Q: 関連記事はどのように決定されますか?
A: 関連記事は、タイトル、カテゴリ、タグ、投稿コンテンツを含む埋め込みに基づいてのみ決定されます。
Q: 特定のトピックを関連記事から除外できますか?
A: はい、結果から閉鎖されたトピックを削除するためのサイト設定があります。
Q: 埋め込みは過去の投稿でも機能しますか?
A: はい、システムはすべてのコンテンツに対して埋め込みを自動的にバックフィルします。




