RAG 未来会支持 PDF 文件吗？

sam · 2024 年11 月 13 日 00:11

JSON 本身就是文本，所以我们已经支持了。

对于大型语言模型来说，它是一种效率低下的表示形式，因为该格式内部存在大量重复，会浪费一些 token，但总体上是可行的。我建议运行一个脚本对其进行处理并重新格式化，以提高 RAG 性能。

这很难自动完成，因为 JSON 可能嵌套很深，选择一种完美的特定领域文本表示形式高度依赖于该领域。

话题		回复	浏览量
PDF support in Discourse AI (RAG) Site Management how-to , ai	20	1081	2025 年12 月 5 日
Is the PDF upload feature for the new AI Bot UX still in development Support ai , ai-bot	2	143	2025 年5 月 9 日
Using PDF and attachment support with AI bots Site Management how-to , ai , ai-bot	0	326	2025 年12 月 11 日
Upload and discuss pdfs in composer Feature ai	5	297	2025 年2 月 24 日
Allow ChatBot to read PDFs so it can join in a group discussion Feature ai , ai-bot	6	1001	2023 年10 月 12 日