Discourse SEO 概述(sitemap / robots.txt)

Discourse 拥有许多开箱即用的 SEO 功能。通过使用我们合理的默认设置,社区经理可以专注于培养社区,而不必分心于搜索引擎优化。话虽如此,但您仍然可以更改一些设置,了解一些信息,并在下面找到一些通用技巧和窍门。

以下是用户所见内容与搜索引擎所见内容之间的比较:

主题列表:

主题:

Meta 标签

在 Discourse 中,对 SEO 至关重要的通用 meta 标签是根据页面上的内容自动生成的。例如,title 标签源自站点或主题标题,description 则由第一个帖子的内容生成。但是,对元数据进行逐页自定义是有限的。要更改这些值,您需要调整生成它们的设置或内容字段。

  • 标题描述简短站点描述站点设置
  • 类别名称
  • 帖子的标题和内容
  • 等等 :technologist:

URL 结构和编码

非拉丁字符和 URL

默认情况下,当区域设置为 EN 时,Discourse 会从主题 URL 中删除非拉丁字符。要避免这种情况,您可以将区域设置为主要的非拉丁语言,或将 slug generation method 设置从 ASCII 更改为 encoded

子文件夹与子域设置

由于其技术简单性,Discourse 更倾向于使用子域而不是子文件夹。Google 实际上并不偏爱两者[^subfolder],但 Discourse 强烈建议避免使用子文件夹设置,除非您有深厚的技术知识。

[^subfolder]:您可以在 Secure Uploads 阅读更多相关信息。

规范化

Google 热衷于索引页面的规范版本。在 Discourse 中,对于有多个回复的主题,规范链接(第一个帖子)会传递给 Google,然后由 Google 决定是否索引。超过 20 个帖子的主题将被分页,每页都是一个包含最多 20 个帖子的规范链接。
例如,最后一个回复的规范标签 此主题 将是 https://meta.discourse.org/t/try-out-the-new-sidebar-and-notification-menus/238821?page=12

Schema Markup

我们使用 schema.org 标记来帮助搜索引擎通过面包屑导航对内容进行分类。主题 slug 中的类别名称包含在内:

Sitemap

Discourse 包含一个位于 /sitemap.xmlsitemap,该 sitemap 默认通过 enable sitemap 设置启用。这有助于搜索引擎更好地索引。

搜索引擎的静态视图

Discourse 提供了一个没有 JavaScript 的静态 HTML 视图,以帮助网络爬虫更快地索引您的站点。动态视图和静态视图之间的内容是相同的,并且在搜索引擎抓取站点时不会遗漏或删除任何内容。

网络爬虫的潜在问题

网络爬虫,也称为机器人,对于索引网页至关重要。然而,一些爬虫可能过于活跃,向论坛发送大量请求。Discourse 默认会阻止几个臭名昭著的爬虫,但如果需要,您可以调整 blocked crawler user agents 设置。

robots.txt

您可以查看并根据需要编辑 robots.txt[^robots]。此文件用作指导网络爬虫如何与论坛内容交互的工具。其主要目的是管理爬虫访问,防止它们压垮服务器,并通过避免索引低价值或重复页面来帮助维护站点的 SEO 健康。

:warning: 未经仔细考虑修改此文件可能会损害您网站的索引。

[^robots]:查找“allow index in robots txt”设置。

迁移和 URL 重定向

永久链接功能用于重定向旧 URL,旨在保留 SEO,防止出现“未找到页面”错误,并帮助搜索引擎使用正确的元数据以便于索引。
如果您的社区站点由我们的团队迁移到 Discourse,则会包含 URL 重定向,除非有充分理由不这样做。

如果您正在使用 现有的导入脚本之一,您应该确保脚本处理了此问题[^permalink]。您可以从管理面板的 CustomizePermalinks 中手动添加永久链接。

[^permalink]:在导入脚本中查找 permalink 字符串应该可以提供此信息。

Discourse 页面浏览量与 Google Analytics 的差异

Discourse 和 Google Analytics 在计算页面浏览量方面的方法不同,这通常会导致 Discourse 中的页面浏览量计数更高。这种差异源于 Discourse 是一个单页应用程序,因此将每次重要的请求都计为一个页面浏览量。

另一方面,Google 使用 Javascript 仅在完全加载页面时计算页面浏览量,默认情况下排除网络爬虫。与 Google 不同,Discourse 计算原始请求并对页面首次加载或路由转换时发出页面浏览量,使其跟踪机制彼此不同。

如果您想了解更多关于数据报告和分析的信息,请查看专用类别:

去索引方法

要将页面从 Google 索引中移除,您可以删除内容或阻止访问页面。根据您的需求,您可以将整个站点设为私有 [^login-only]。您可以通过删除主题或将其放入受限类别来排除主题。隐藏的主题默认不会被索引,但如果存在指向它的公共链接,则可能会被索引。

要实现永久移除,请使用 Google Search Console 中的 Removals 工具,以将页面保留在搜索结果之外。

在此处了解更多信息 Remove information on your website from Google - Search Console Help

[^login-only]:查找 login required 设置。

19 个赞

感谢您提供的关于 Discourse 的详细 SEO 概述! 作为一名与各种平台合作的 SEO 专家,我发现了解 Discourse 如何处理 sitemap.xmlrobots.txt 等基本元素非常有帮助。 默认设置对 SEO 非常友好,但我很好奇是否有任何最佳实践或插件推荐,可以进一步增强 Discourse 论坛上的索引控制或模式标记集成。

期待向社区学习更多知识,并在力所能及的地方做出贡献!

2 个赞