現在の制限事項:
• フォーラムのセマンティック検索は、投稿テキストのみをインデックス化し、PDF添付ファイルはインデックス化しません
• PDFファイルは、/search AIトグル経由で検索できません
• これを回避するために、PDFを個別にペルソナRAGに手動でアップロードする必要がありました
提案される解決策:
• 埋め込み生成中にPDF添付ファイルからテキストを抽出する
• 投稿テキストと並行してPDFコンテンツをインデックス化する
• PDFが添付されたトピックをセマンティック検索で発見可能にする
利点:
• ユーザーはフォーラム検索を通じて技術文書を見つけられるようになります
• コンテンツの重複(フォーラム投稿 + RAGアップロード)が不要になります
• SEOの向上(インデックス化されたトピックにPDFが添付されるため)
• アーキテクチャの簡素化(Searchコマンドが機能するようになる)
これを実装した場合、以下のことが可能になる可能性があります。
- 強制ツールを削除する(検索がPDFコンテンツを自然に見つけるようになるため)
- RAGアップロードを完全に排除する(すべてをフォーラムトピック内に収める)
- システムを大幅に簡素化する