Discourse 拥有许多开箱即用的 SEO 功能。通过使用我们合理的默认设置,社区经理可以专注于培养社区,而不必分心于搜索引擎优化。话虽如此,但您仍然可以更改一些设置,了解一些信息,并在下面找到一些通用技巧和窍门。
以下是用户所见内容与搜索引擎所见内容之间的比较:
主题列表:
主题:
Meta 标签
在 Discourse 中,对 SEO 至关重要的通用 meta 标签是根据页面上的内容自动生成的。例如,title 标签源自站点或主题标题,description 则由第一个帖子的内容生成。但是,对元数据进行逐页自定义是有限的。要更改这些值,您需要调整生成它们的设置或内容字段。
- 标题、描述和简短站点描述站点设置
- 类别名称
- 帖子的标题和内容
- 等等

URL 结构和编码
非拉丁字符和 URL
默认情况下,当区域设置为 EN 时,Discourse 会从主题 URL 中删除非拉丁字符。要避免这种情况,您可以将区域设置为主要的非拉丁语言,或将 slug generation method 设置从 ASCII 更改为 encoded。
子文件夹与子域设置
由于其技术简单性,Discourse 更倾向于使用子域而不是子文件夹。Google 实际上并不偏爱两者[^subfolder],但 Discourse 强烈建议避免使用子文件夹设置,除非您有深厚的技术知识。
[^subfolder]:您可以在 Secure Uploads 阅读更多相关信息。
规范化
Google 热衷于索引页面的规范版本。在 Discourse 中,对于有多个回复的主题,规范链接(第一个帖子)会传递给 Google,然后由 Google 决定是否索引。超过 20 个帖子的主题将被分页,每页都是一个包含最多 20 个帖子的规范链接。
例如,最后一个回复的规范标签 此主题 将是 https://meta.discourse.org/t/try-out-the-new-sidebar-and-notification-menus/238821?page=12。
Schema Markup
我们使用 schema.org 标记来帮助搜索引擎通过面包屑导航对内容进行分类。主题 slug 中的类别名称包含在内:
Sitemap
Discourse 包含一个位于 /sitemap.xml 的 sitemap,该 sitemap 默认通过 enable sitemap 设置启用。这有助于搜索引擎更好地索引。
搜索引擎的静态视图
Discourse 提供了一个没有 JavaScript 的静态 HTML 视图,以帮助网络爬虫更快地索引您的站点。动态视图和静态视图之间的内容是相同的,并且在搜索引擎抓取站点时不会遗漏或删除任何内容。
网络爬虫的潜在问题
网络爬虫,也称为机器人,对于索引网页至关重要。然而,一些爬虫可能过于活跃,向论坛发送大量请求。Discourse 默认会阻止几个臭名昭著的爬虫,但如果需要,您可以调整 blocked crawler user agents 设置。
robots.txt
您可以查看并根据需要编辑 robots.txt[^robots]。此文件用作指导网络爬虫如何与论坛内容交互的工具。其主要目的是管理爬虫访问,防止它们压垮服务器,并通过避免索引低价值或重复页面来帮助维护站点的 SEO 健康。
未经仔细考虑修改此文件可能会损害您网站的索引。
[^robots]:查找“allow index in robots txt”设置。
迁移和 URL 重定向
永久链接功能用于重定向旧 URL,旨在保留 SEO,防止出现“未找到页面”错误,并帮助搜索引擎使用正确的元数据以便于索引。
如果您的社区站点由我们的团队迁移到 Discourse,则会包含 URL 重定向,除非有充分理由不这样做。
如果您正在使用 现有的导入脚本之一,您应该确保脚本处理了此问题[^permalink]。您可以从管理面板的 Customize → Permalinks 中手动添加永久链接。
[^permalink]:在导入脚本中查找 permalink 字符串应该可以提供此信息。
Discourse 页面浏览量与 Google Analytics 的差异
Discourse 和 Google Analytics 在计算页面浏览量方面的方法不同,这通常会导致 Discourse 中的页面浏览量计数更高。这种差异源于 Discourse 是一个单页应用程序,因此将每次重要的请求都计为一个页面浏览量。
另一方面,Google 使用 Javascript 仅在完全加载页面时计算页面浏览量,默认情况下排除网络爬虫。与 Google 不同,Discourse 计算原始请求并对页面首次加载或路由转换时发出页面浏览量,使其跟踪机制彼此不同。
如果您想了解更多关于数据报告和分析的信息,请查看专用类别:
去索引方法
要将页面从 Google 索引中移除,您可以删除内容或阻止访问页面。根据您的需求,您可以将整个站点设为私有 [^login-only]。您可以通过删除主题或将其放入受限类别来排除主题。隐藏的主题默认不会被索引,但如果存在指向它的公共链接,则可能会被索引。
要实现永久移除,请使用 Google Search Console 中的 Removals 工具,以将页面保留在搜索结果之外。
在此处了解更多信息 Remove information on your website from Google - Search Console Help
[^login-only]:查找 login required 设置。




