本主题介绍 Discourse AI 插件的 Embeddings 模块的配置。它解释了什么是嵌入 (embeddings),它们如何使用,以及如何设置它们。
所需用户级别:管理员
嵌入是 Discourse AI 插件的关键组成部分,它支持 相关主题 和 AI 搜索 等功能。本指南将引导您完成在您的 Discourse 实例中设置和使用嵌入的过程。
什么是嵌入 (Embeddings)?
嵌入是文本的数值表示,用于捕捉语义含义。在 Discourse 中,它们用于:
- 在主题页面底部生成相关主题
- 实现语义搜索功能
设置嵌入 (Embeddings)
对于托管客户
如果您是托管客户,嵌入已预先配置好。您可以简单地启用依赖于它们的 AI 功能。
对于自托管实例
如果您是自托管,请参阅 Discourse AI 自托管指南 以获取详细的设置说明。
配置嵌入定义 (Embedding Definitions)
嵌入模型现在在管理员 UI 中配置为 嵌入定义 (Embedding Definitions)。导航到 Admin → AI plugin → Embeddings 选项卡。添加新的嵌入定义时,您可以从预配置的 预设 (presets) 中选择,或手动配置一个。
可用预设包括:
- text-embedding-3-large (OpenAI)
- text-embedding-3-small (OpenAI)
- text-embedding-ada-002 (OpenAI)
- gemini-embedding-001 (Google)
- bge-large-en (Hugging Face)
- bge-m3 (Hugging Face)
- multilingual-e5-large (Hugging Face)
每个嵌入定义包括:显示名称、提供商、URL、API 密钥(或 AI Secret)、分词器 (tokenizer)、维度、距离函数、最大序列长度以及可选的嵌入/搜索提示。
配置嵌入 (embeddings)
导航到 Admin → Plugins → Discourse AI,确保启用以下设置。
- ai embeddings enabled:开启或关闭嵌入模块
- ai embeddings selected model:选择要用于生成嵌入的模型定义
可以调整的可选设置……
- AI embeddings generate for pms:决定是否为私人消息生成嵌入
- AI embeddings semantic related topics enabled:启用或禁用“相关主题”功能
- AI embeddings semantic related topics:要显示的相关主题的最大数量
- AI embeddings semantic related include closed topics:在相关主题结果中包含已关闭的主题
- AI embeddings semantic related age penalty:对相关结果中的主题应用指数级年龄惩罚(0.0 禁用,值越高对旧主题的惩罚越大)
- AI embeddings semantic related age time scale:年龄惩罚计算的时间尺度(以天为单位)(默认:365)
- AI embeddings semantic search enabled:启用全页 AI 搜索
- AI embeddings semantic quick search enabled:在搜索菜单弹出窗口中启用语义搜索选项
- AI embeddings semantic search use hyde:为语义搜索启用 HyDE(假设文档嵌入)
- AI embeddings semantic search hyde agent:启用 HyDE 时用于扩展搜索词的 AI 代理
提供商 (Providers)
Discourse AI 支持多种嵌入提供商:
- OpenAI
- Hugging Face(用于开源/开放权重模型)
- Cloudflare Workers AI
对于托管客户,Discourse 提供开箱即用的预配置(预置)嵌入定义。
功能 (Features)
相关主题 (Related Topics)
启用后,“相关主题”部分会出现在主题页面底部,链接到语义相似的讨论。
AI 搜索 (AI Search)
嵌入为全页搜索界面上的语义搜索选项提供支持。
语义搜索可以选择使用 HyDE(假设文档嵌入)。当通过 ai embeddings semantic search use hyde 启用时,搜索词会使用 ai embeddings semantic search hyde agent 中配置的 AI 代理进行扩展。然后,扩展后的搜索会被转换为向量,用于查找相似的主题。此技术会增加搜索的延迟,但可以提高结果质量。
在为 HyDE 选择代理时,请选择一个快速的模型,如 Gemini Flash、Claude Haiku、GPT-4o Mini 或最新的可用模型。
生成嵌入 (Generating embeddings)
嵌入会为新帖子自动生成。要为现有内容生成嵌入:
- Discourse 将通过每 5 分钟运行的计划作业自动填充旧主题的嵌入
- 填充过程按最近活动的顺序处理主题
常见问题 (FAQs)
问:相关主题是如何确定的?
答:相关主题完全基于嵌入,这些嵌入包括标题、分类、标签和帖子内容
问:我能从相关主题中排除某些主题吗?
答:是的,有一个站点设置可以将已关闭的主题从结果中移除
问:嵌入对历史帖子有效吗?
答:是的,系统会自动为您的所有内容填充嵌入




