検索用インデックスファイルの内容

dennisjbr · 2026 年 4 月 21 日午前 7:34

さて、この件について調べており、AI を使って最適な実現方法のワイヤーフレームを作成しています。いくつかアイデアが浮かびます。Apache TIKA を使用すれば、画像を含むほぼあらゆるテキストファイルの OCR が可能です。これはセルフホスト型のオプションです。あるいは、Gemini Flash 1.5（例）を使って、OCR だけでなく、閲覧・分析されている画像の説明も生成し、そのデータを検索用に PostgreSQL のテーブルやカラムに格納するという方法もあります。もちろん、添付ファイルやアップロードされたすべての投稿を再処理するために、多量のトークンを事前に投資する必要がありますが、最も有用なアプローチでしょう。結局、支払った分だけの結果が得られるものですね。

トピック		返信	表示
Index PDFs for search Support	1	390	2023 年 10 月 7 日
Searchable File Attachments Feature	12	2885	2022 年 5 月 3 日
Add support for searching pdf files in forum topics from AI personas Feature	3	143	2025 年 12 月 12 日
Browser-based PDF Viewer with search and highlighting capabilities Feature	9	2625	2020 年 12 月 15 日
Upload and discuss pdfs in composer Feature ai	5	314	2025 年 2 月 24 日

検索用インデックスファイルの内容

関連トピック