さて、この件について調べており、AI を使って最適な実現方法のワイヤーフレームを作成しています。いくつかアイデアが浮かびます。Apache TIKA を使用すれば、画像を含むほぼあらゆるテキストファイルの OCR が可能です。これはセルフホスト型のオプションです。あるいは、Gemini Flash 1.5(例)を使って、OCR だけでなく、閲覧・分析されている画像の説明も生成し、そのデータを検索用に PostgreSQL のテーブルやカラムに格納するという方法もあります。もちろん、添付ファイルやアップロードされたすべての投稿を再処理するために、多量のトークンを事前に投資する必要がありますが、最も有用なアプローチでしょう。結局、支払った分だけの結果が得られるものですね。
「いいね!」 1