当前限制:
• 论坛语义搜索仅索引帖子文本,不索引 PDF 附件
• PDF 文件无法通过 /search AI 切换进行搜索
• 为解决此问题,我不得不将 PDF 单独手动上传到 persona RAG
建议的解决方案:
• 在嵌入生成过程中提取 PDF 附件中的文本
• 将 PDF 内容与帖子文本一起索引
• 使附加了 PDF 的主题可通过语义搜索发现
优势:
• 用户可通过论坛搜索找到技术文档
• 无需复制内容(论坛帖子 + RAG 上传)
• 更好的 SEO(附加到已索引主题的 PDF)
• 更简单的架构(Search 命令即可工作)
如果您实施此方案,我可能会:
- 移除强制工具(搜索将自然找到 PDF 内容)
- 完全消除 RAG 上传(所有内容都在论坛主题中)
- 显著简化系统