RAGは将来PDFファイルに対応しますか?

2つの投稿が新しいトピックに分割されました: AIプラグインのRakeタスクが動作しない

これは現在サポートされており、基本的なドキュメントが以下で公開されています。

なお、高度な処理には現時点ではコンテナの変更が必要になります。これは、@featheredtoast / @tgxworld が ImageMagick のサポートをリファクタリング中で、誤って Ghostscript のサポートを削除してしまったためです。

これは手動で設定できますが、ここで投稿できる範囲を超えています。手間のかかる手順ですので、高度な処理を待っている方は数週間お待ちください。

「いいね!」 7

非常に的確なご指摘です。また、テキストが含まれているPDFの中にも、実際のテキストではなく画像ファイルとして扱われる「怠惰なスキャン」のものがあります。

「いいね!」 1