AIボットでのPDFと添付ファイルサポートの利用

:bookmark: このガイドでは、Discourse で AI ボットと対話する際に、ネイティブの PDF およびドキュメント添付ファイルサポートを有効にして使用する方法について説明します。ユーザーは AI ペルソナとの会話で PDF やその他のドキュメントを直接アップロードできます。

:person_raising_hand: 必要なユーザーレベル: 管理者

概要

Discourse AI はネイティブの添付ファイル処理をサポートするようになり、ユーザーは AI ボットとの会話中に PDF やその他のドキュメントタイプを直接アップロードできるようになりました。AI はこれらの添付ファイルのコンテンツを読み取り、理解できるため、アップロードされたファイルに基づくドキュメント分析、要約、質疑応答などのユースケースが可能になります。

この機能には以下が必要です。

  • ビジョンが有効な LLM モデル
  • LLM で許可された添付ファイルタイプが設定されていること
  • ビジョンをサポートするペルソナ
  • サイトのアップロード設定でファイル拡張子が承認されていること

サポートされているプロバイダー

ネイティブの添付ファイルサポートは、次のプロバイダーのモデルで機能します。

  • Anthropic (Claude モデル)
  • Google (Gemini モデル)
  • OpenAI (GPT モデル)

各プロバイダーは API レベルで添付ファイルの処理方法が異なりますが、Discourse AI がこれを自動的に管理します。プロバイダーによって、さまざまな添付ファイルタイプに対するサポートレベルが異なる場合があることに注意してください。

サポートされている添付ファイルタイプ

次のドキュメントタイプは、AI 処理のために設定できます。

タイプ 拡張子
PDF pdf
プレーンテキスト txt
Microsoft Word doc, docx
リッチテキスト形式 rtf
HTML html, htm
Markdown md, markdown

:information_source: 画像は「ビジョンが有効」設定を通じて個別に処理され、添付ファイルタイプの構成は必要ありません。

設定

ステップ 1: アップロード用のファイル拡張子の承認

ユーザーが添付ファイルをアップロードできるようにする前に、サイト設定でファイル拡張子が承認されていることを確認してください。

  1. 管理者ファイル に移動します
  2. authorized extensions (承認された拡張子) 設定を見つけます
  3. 許可したい拡張子を追加します (例: pdf|txt|docx)

ステップ 2: LLM モデルの設定

  1. 管理者プラグインDiscourse AILLM に移動します
  2. 設定したい LLM モデルを選択します (または新しいモデルを作成します)
  3. Vision enabled (ビジョンが有効) を有効にします - これは添付ファイルサポートに必要です
  4. Allowed attachments (許可された添付ファイル) フィールドで、モデルが受け入れるファイル拡張子を選択または入力します (例: pdf, txt, docx)

allowed attachmentsでpdf / txtの選択を示すllm設定

:warning: 「Allowed attachments」フィールドを空白のままにすると、そのモデルのドキュメント添付ファイルは無効になります。画像は「Vision enabled」トグルによって個別に制御されます。

ステップ 3: ペルソナの設定

  1. 管理者プラグインDiscourse AIAI Personas に移動します
  2. ペルソナを選択または作成します
  3. ペルソナで Vision support (ビジョンサポート) が有効になっていることを確認します
  4. Default model (デフォルトモデル) を、ビジョンと添付ファイルが設定されている LLM に設定します

仕組み

ユーザーが AI ボットとの会話でドキュメントをアップロードすると、次のようになります。

  1. ドキュメントは標準のアップロード処理を使用して Discourse にアップロードされます
  2. Discourse AI はドキュメントコンテンツをエンコードします (base64)
  3. エンコードされたコンテンツは、ユーザーのメッセージとともに LLM に送信されます
  4. LLM はテキストメッセージとドキュメントコンテンツの両方を処理します
  5. AI は結合されたコンテキストに基づいて応答します

画像

技術的な詳細

  • ドキュメントは base64 としてエンコードされ、リクエストにインラインで送信されます
  • 各プロバイダーは、ネイティブ形式で添付ファイルを受け取ります。
    • Anthropic: base64 ソースを持つ document タイプを使用します
    • Gemini: inlineData 形式を使用します
    • OpenAI: base64 コンテンツを含む file_data を持つ file タイプを使用します
  • ファイルサイズの上限は、サイトの max attachment size kb 設定によって決まります。

ユースケース

ネイティブの添付ファイルサポートにより、いくつかのワークフローが可能になります。

  • ドキュメント分析: 契約書、レポート、または研究論文をアップロードして、AI に要約させたり、質問に答えさせたりします。
  • コンテンツレビュー: AI にドラフトドキュメントをレビューさせ、フィードバックを提供させます。
  • データ抽出: アップロードされたドキュメントから特定の情報を抽出します。
  • 翻訳支援: ある言語のドキュメントをアップロードし、コンテンツについて議論したり、翻訳をリクエストしたりします。
  • 技術サポート: トラブルシューティング支援のために、ログファイルや設定ファイルをアップロードできます。

制限事項

  • ファイルサイズ: 添付ファイルは、サイトのアップロードサイズ設定と LLM ベンダーによって制限されます。
  • プロバイダーサポート: 現在、Anthropic、Google、OpenAI のモデルのみが添付ファイルをサポートしています。
  • ビジョン要件: LLM でビジョン機能が有効になっている必要があります。
  • 拡張子の照合: ファイル拡張子は、サイトでアップロードが承認されており、LLM の添付ファイルタイプの構成で許可されている必要があります。
  • 結果のばらつき: LLM ベンダーや LLM によってファイル処理のコスト、精度、結果が異なります。Anthropic は、OpenAI や Google よりも分析に多くのトークンを使用する傾向があります。
  • キャッシュの有効化: OpenAI の場合は、より一貫したキャッシュサポートを提供するレスポンス API を使用するようにしてください (思考が有効な場合)。Anthropic モデルの場合は、LLM 設定でキャッシュを明示的に有効にする必要がある場合があります。これは、複数ターンの会話を行う場合に特に重要になることがあります。

トラブルシューティング

添付ファイルが処理されない

  1. ファイル拡張子がサイトの authorized extensions 設定に含まれていることを確認します
  2. LLM で「Vision enabled」がオンになっていることを確認します
  3. ファイルタイプが LLM の「Allowed attachments」設定にリストされていることを確認します
  4. ペルソナでビジョンサポートが有効になっており、適切に設定された LLM を使用していることを確認します

アップロードが失敗する

  • max attachment size kb 設定を確認します
  • ファイル拡張子が承認されていることを確認します
  • 非常に大きな PDF はサポートされない場合があります。各 LLM ベンダーには異なる最大アップロードサイズがあります。

AI がドキュメントを理解しない

  • ドキュメント理解をサポートするモデルを使用していることを確認します
  • より高性能なモデルを試してください (例: Claude Sonnet 4.5、GPT-5.1、Gemini Pro 3)

FAQ

ユーザーは 1 つのメッセージで複数のドキュメントをアップロードできますか?
はい、ユーザーは 1 つのメッセージに複数の添付ファイルを含めることができ、AI はそれらすべてにアクセスできます。

これはチャットとプライベートメッセージの両方で機能しますか?
はい、添付ファイルサポートは、ペルソナがそれらの対話方法用に設定されていれば、AI ボットとのプライベートメッセージとチャットのダイレクトメッセージの両方で機能します。

これはペルソナの RAG アップロードとは異なりますか?
はい。RAG アップロードは、管理者がペルソナのナレッジベースに追加するドキュメントであり、インデックス化されて検索されます。ネイティブの添付ファイルサポートは、エンドユーザーが会話中にドキュメントをアップロードし、即座に分析できるようにするもので、インデックス化は行われません。

アップロードされたドキュメントはどうなりますか?
ドキュメントは、サイトの標準のアップロード処理および保持ポリシーに従って処理されます。通常の Discourse アップロードとして保存されます。

追加リソース

「いいね!」 4