AIボットでのPDFおよび添付ファイルサポートの利用

:bookmark: このガイドでは、Discourse で AI ボットと対話する際に、ネイティブの PDF およびドキュメント添付ファイルサポートを有効にして使用する方法について説明します。ユーザーは、AI エージェントとの会話に PDF やその他のドキュメントを直接アップロードできます。

:person_raising_hand: 必要なユーザーレベル: 管理者

概要

Discourse AI はネイティブの添付ファイル処理をサポートするようになり、ユーザーは AI ボットとの会話中に PDF やその他のドキュメントタイプを直接アップロードできるようになりました。AI はこれらの添付ファイルのコンテンツを読み取り、理解できるため、アップロードされたファイルに基づいたドキュメント分析、要約、質疑応答などのユースケースが可能になります。

この機能には以下が必要です。

  • LLM で許可された添付ファイルタイプが設定されていること
  • ビジョンが有効になっているエージェント(これにより、アップロードがメッセージに含まれるかどうかが制御されます)
  • サイトのアップロード設定でファイル拡張子が承認されていること

サポートされているプロバイダー

ネイティブの添付ファイルサポートは、次のプロバイダーのモデルで動作します。

  • Anthropic (Claude モデル)
  • AWS Bedrock (Bedrock 経由の Claude モデル)
  • Google (Gemini モデル)
  • OpenAI (GPT モデル)
  • Azure (OpenAI 互換モデル)
  • OpenRouter (OpenAI 互換モデル)

各プロバイダーは API レベルで添付ファイルの処理方法が異なりますが、Discourse AI がこれを自動的に管理します。プロバイダーごとに、さまざまな添付ファイルタイプに対するサポートのレベルが異なる場合があることに注意してください。

サポートされている添付ファイルタイプ

次のドキュメントタイプは、AI 処理のために設定できます。

タイプ 拡張子
PDF pdf
プレーンテキスト txt
Microsoft Word doc, docx
リッチテキスト形式 rtf
HTML html, htm
Markdown md, markdown

:information_source: 画像は「ビジョンが有効」設定を介して別途処理され、添付ファイルタイプの構成は必要ありません。

設定

ステップ 1: アップロード用のファイル拡張子の承認

ユーザーが添付ファイルをアップロードできるようにする前に、サイト設定でファイル拡張子が承認されていることを確認してください。

  1. 管理者ファイル に移動します。
  2. authorized extensions (承認された拡張子) 設定を見つけます。
  3. 許可する拡張子を追加します (例: pdf|txt|docx)。

ステップ 2: LLM モデルの設定

  1. 管理者プラグインDiscourse AILLMs に移動します。
  2. 設定する LLM モデルを選択します(または新しいモデルを作成します)。
  3. Allowed attachments (許可された添付ファイル) フィールドで、モデルが受け入れるファイル拡張子を選択または入力します (例: pdf, txt, docx)。

:warning: 「Allowed attachments」フィールドを空白のままにすると、そのモデルではドキュメント添付ファイルは無効になります。画像は「Vision enabled」トグルで別途制御されます。

ステップ 3: エージェントの設定

  1. 管理者プラグインDiscourse AIAgents に移動します。
  2. エージェントを選択または作成します。
  3. Vision enabled (ビジョンが有効) がオンになっていることを確認します — これにより、アップロード(画像とドキュメントの両方)が LLM に送信されるメッセージに含まれるかどうかが制御されます。
  4. Default model (デフォルトモデル) を、添付ファイルが設定されている LLM に設定します。

仕組み

ユーザーが AI ボットとの会話でドキュメントをアップロードすると:

  1. ドキュメントは標準のアップロード処理を使用して Discourse にアップロードされます。
  2. Discourse AI はドキュメントコンテンツをエンコードします (base64)。
  3. エンコードされたコンテンツは、ユーザーのメッセージと共に LLM に送信されます。
  4. LLM はテキストメッセージとドキュメントコンテンツの両方を処理します。
  5. AI は結合されたコンテキストに基づいて応答します。

技術的な詳細

  • ドキュメントは base64 としてエンコードされ、リクエストにインラインで送信されます。
  • 各プロバイダーは、ネイティブ形式で添付ファイルを受け取ります。
    • Anthropic: base64 ソースを持つ document タイプを使用します。
    • Gemini: inlineData 形式を使用します。
    • OpenAI (Chat Completions API): base64 コンテンツを含む file_data を持つ file タイプを使用します。
    • OpenAI (Responses API): base64 コンテンツを含む file_data を持つ input_file タイプを使用します。
  • ファイルサイズの上限は、サイトの max attachment size kb 設定によって規制されます。

ユースケース

ネイティブの添付ファイルサポートにより、いくつかのワークフローが可能になります。

  • ドキュメント分析: 契約書、レポート、研究論文などをアップロードし、AI に要約させたり、質問に答えさせたりします。
  • コンテンツレビュー: AI に下書きドキュメントのレビューとフィードバックの提供を行わせます。
  • データ抽出: アップロードされたドキュメントから特定の情報を抽出します。
  • 翻訳支援: ある言語のドキュメントをアップロードし、コンテンツについて議論したり、翻訳を依頼したりします。
  • テクニカルサポート: トラブルシューティングの支援のために、ログファイルや設定ファイルをアップロードできます。

制限事項

  • ファイルサイズ: 添付ファイルは、サイトのアップロードサイズ設定と LLM ベンダーによって制限されます。
  • プロバイダーサポート: 添付ファイルのサポートには、ドキュメントを処理するプロバイダーダイアレクト(Anthropic、AWS Bedrock、Google、OpenAI、Azure、OpenRouter)が必要です。
  • エージェントのビジョン要件: アップロードがメッセージに含まれるためには、エージェントで「Vision enabled」をオンにする必要があります。
  • 拡張子の照合: ファイル拡張子は、サイトでアップロード用に承認されていることと、LLM の添付ファイルタイプ設定で許可されていることの両方が必要です。
  • 結果のばらつき: LLM ベンダーと LLM がファイルを処理するため、コスト、精度、結果は異なります。Anthropic は、分析のために OpenAI や Google よりも多くのトークンを使用する傾向があります。
  • キャッシングの有効化: Open AI の場合は、キャッシングのサポートがより一貫している応答 API を使用するようにしてください(思考が有効な場合)。Anthropic モデルの場合は、LLM 設定でキャッシングを明示的に有効にする必要がある場合があります。これは、複数ターンの会話を行う場合に特に重要です。

トラブルシューティング

添付ファイルが処理されない

  1. ファイル拡張子がサイトの authorized extensions 設定に含まれていることを確認します。
  2. ファイルタイプが LLM の「Allowed attachments」設定にリストされていることを確認します。
  3. エージェントで「Vision enabled」がオンになっており、適切に設定された LLM を使用していることを確認します。

アップロードが失敗する

  • max attachment size kb 設定を確認します。
  • ファイル拡張子が承認されていることを確認します。
  • 非常に大きな PDF はサポートされない場合があります。各 LLM ベンダーには、最大アップロードサイズが異なります。

AI がドキュメントを理解しない

  • ドキュメント理解をサポートするモデルを使用していることを確認します。
  • より高性能なモデルを試してください(例: Claude Sonnet 4.5、GPT-5.1、Gemini Pro 3)。

FAQ

ユーザーは 1 つのメッセージで複数のドキュメントをアップロードできますか?
はい、ユーザーは 1 つのメッセージに複数の添付ファイルを含めることができ、AI はすべてにアクセスできます。

これはチャットでもプライベートメッセージでも機能しますか?
はい、添付ファイルサポートは、エージェントがそれらの対話方法用に設定されていれば、AI ボットとのプライベートメッセージとチャットダイレクトメッセージの両方で機能します。

これはエージェントでの RAG アップロードとは異なりますか?
はい。RAG アップロードは、管理者がエージェントのナレッジベースに追加し、インデックス化および検索されるドキュメントです。ネイティブの添付ファイルサポートは、エンドユーザーがインデックス化なしで即時分析のために会話中にドキュメントをアップロードできるようにするものです。

アップロードされたドキュメントはどうなりますか?
ドキュメントは、サイトの標準のアップロード処理および保持ポリシーに従って処理されます。通常の Discourse アップロードとして保存されます。

追加リソース

「いいね!」 4