在 Discourse-AI 中,我们开始试验语义搜索。这仍处于早期阶段,我们仍在探索这些系统。
使用 LLM 改进搜索提示也是一种可能的方法(尽管今天很慢):
这项技术在此处有提及:GitHub - texttron/hyde: HyDE: Precise Zero-Shot Dense Retrieval without Relevance Labels
除了 100% 自动化方法之外
我们在这里的总体策略是迭代。产品中已经有“监视词”,我乐于看到一个添加“搜索同义词”的功能,您可以在其中指定常见的拼写错误和您希望“填充”的常用短语。这并非计划中的工作,但绝对是您可以考虑赞助的内容。
根据:PostgreSQL: Documentation: 18: 12.6. Dictionaries 中已有此确切功能的先例
我愿意探索的另一个领域(但我对此只是不冷不热)是允许在帖子中设置隐藏的“元数据”区域,管理员可以在其中填充搜索词。这非常非常不显眼,通常我建议“正确地”填充内容,以免内容被隐藏,例如:
SEO
semantic, related, improving



