Discourse AI 与 检索增强生成

Discourse AI 看起来很棒,我非常渴望在我的自托管实例上设置它!

我有一个关于助手机器人和嵌入式的问题(或者可能是一个功能请求):我能否选择哪些主题用于检索增强生成(RAG)?例如,如果我能将插件配置为仅为官方文档类别中的主题计算嵌入,那将是惊人的。我担心如果机器人使用我们论坛上的所有内容来构建向量数据库,输出将不够好。仅为具有特定标签或已解决主题的主题计算嵌入也会很有趣。我对 RAG 工作流程的细节感到好奇。Discourse AI 是否有 RAG 工作流程?我们是否能够控制哪些文档被添加到向量数据库中?如果我们已经有一组嵌入,我们能否在调用助手或语义搜索时配置 Discourse AI 使用它们?

我在这里简要地看到了这一点,但我很想了解更多细节!

2 个赞

现在还不行,但我非常喜欢这个功能请求。

我们的 search command 目前没有任何参数,当你选择它时:

所以这里的功能请求是允许你为添加的各种命令指定一些额外的参数。我非常喜欢这个想法,只是需要仔细考虑一下用户界面和数据结构。

4 个赞

{“content”:“[quote="aas, post:1, topic:286378, full:true"]\nDiscourse AI 看起来很棒,我非常渴望在我的自托管实例上设置它!\n\n我有一个关于助手机器人和嵌入式的问题(或者可能是一个功能请求):我能否选择哪些主题用于检索增强生成 (RAG)? 例如,如果我能将插件配置为仅为官方文档类别中的主题计算嵌入,那将是惊人的。我担心如果机器人使用我们论坛上的所有内容来构建向量数据库,输出质量将不够好。另外,配置它仅为具有特定标签或已解决主题的主题计算嵌入也会很有趣。我对 RAG 工作流的详细信息很感兴趣。Discourse AI 是否有 RAG 工作流?我们能否控制哪些文档被添加到向量数据库?如果我们已经有一组嵌入,我们能否配置 Discourse AI 在调用助手或语义搜索时使用它们?\n\n我在这里简要地看到了这一点,但我很想了解更多细节!\n\n[quote]\n除了将 Discourse UI 用作外部 LLM 的前端之外,此模型还基于 Discourse 集成构建了什么?对于我们的大多数模型,我们正在研究 RAG,我们可以创建一些开箱即用的 LLM 也无法提供的功能。\n[/quote]\n[/quote]\n\n据我所知,Discourse AI 插件仅使用论坛上的所有帖子构建向量数据库,但这种方法将得到改进,允许用户指定应包含哪些文档。这将实现对训练数据的更精细控制,并提高生成响应的质量。\n\n此外,结合预先计算的嵌入的能力仍在探索中……”,“target_locale”:“zh_CN”}

1 个赞

FYI this is implemented now :confetti_ball:

添加搜索工具时,您可以控制搜索参数。如果添加 Bug,它将仅搜索 bug。

2 个赞