请,请为 AI 角色在论坛主题中添加搜索 PDF 文件支持——无需单独上传!

当前限制:
• 论坛语义搜索仅索引帖子文本,不索引 PDF 附件
• PDF 文件无法通过 /search AI 切换进行搜索
• 为解决此问题,我不得不将 PDF 单独手动上传到 persona RAG

建议的解决方案:
• 在嵌入生成过程中提取 PDF 附件中的文本
• 将 PDF 内容与帖子文本一起索引
• 使附加了 PDF 的主题可通过语义搜索发现

优势:
• 用户可通过论坛搜索找到技术文档
• 无需复制内容(论坛帖子 + RAG 上传)
• 更好的 SEO(附加到已索引主题的 PDF)
• 更简单的架构(Search 命令即可工作)

如果您实施此方案,我可能会:

  1. 移除强制工具(搜索将自然找到 PDF 内容)
  2. 完全消除 RAG 上传(所有内容都在论坛主题中)
  3. 显著简化系统
1 个赞

这里有一个关于为 ai-search 索引文件的类似主题:Index File Contents for Search

2 个赞

我认为一个插件可能会将文本添加到已处理帖子的可选隐藏详情元素中。我想这样它就会被找到。如果你是自托管的,我认为开发它只需要几百美元。或者,如果听起来他们有兴趣,以大约两倍的成本(包括测试等)作为拉取请求(PR)提交。

供您参考——我发现将 PDF 文件上传到 persona 会阻止它在 ai 辅助搜索中找到“正常”的论坛内容。因此,我采用了以下两种方法的组合:(a) 将关键文件转换为 markdown(这样我就可以将它们直接作为主题发布)或 (b) 提取主要关键词/目录等,并将它们与 PDF 文件一起发布到论坛中。我还不得不从 GPT 4.1 切换到 Sonnet 4.5 并禁用 HYDE 以使其可靠。