Google 通知从 robots.txt 中移除“noindex”声明

你好,

我刚刚收到了谷歌的这封邮件:

从 robots.txt 中移除“noindex”指令

社区里有人遇到过这种情况吗?我需要采取什么措施吗?

谢谢

看起来谷歌刚刚发布了这个,我也收到了一封邮件。

我也是,发帖是为了关注各种意见等。

同样的邮件,我需要自己处理吗?该如何处理?

别担心,这已编码在核心中,Discourse 团队将对其进行更新,几天内即可修复,我们只需升级我们的 Discourse 即可。

不过,对于最急切的用户,现在可以编辑 robots.txt 文件了:

Google Search Console 正在向我们发送有关 Discourse 站点的消息:

请从 https://discourse.hookproductivity.com/ 的 robots.txt 文件中移除 ‘noindex’ 指令。

https://discourse.hookproductivity.com/ 的站长:

Google 已识别出您网站的 robots.txt 文件中包含不受支持的指令 ‘noindex’。

该指令从未得到 Google 的官方支持,并将于 2019 年 9 月 1 日起停止生效。请参阅我们的帮助中心,了解如何阻止页面被 Google 索引。

如果您尚未自定义 robots.txt 文件,则无需执行任何操作……disallow 已经承担了大部分工作。

默认情况下,Discourse 在 robots.txt 中同时使用 disallownoindex

关于此更新的官方博客文章 中,Google 建议使用 disallow,而我们早已采用此做法。我们额外使用 noindex 以帮助避免 Google 提到的链接问题(我已对相关部分加粗强调)……

robots.txt 中的 Disallow:搜索引擎只能索引它们已知的页面,因此阻止页面被爬取通常意味着其内容不会被索引。尽管搜索引擎也可能根据其他页面的链接对 URL 进行索引,但在未看到内容本身的情况下,我们的目标是使此类页面在未来更不易被看到。

在我们这边,我们将考虑进行更新,添加 noindex 元标签,或在 HTTP 响应中使用 X-Robots-Tag 头,以确保当链接出现在其他页面上时,Google 不会对其进行索引(如有任何变更,我们将在此主题中更新)。

如果您已通过 /admin/customize/robots 管理页面在 robots.txt 中添加了自定义的 noindex 规则,请将其更改为 disallow

robots.txt 中包含 noindex 是一项不明智的“SEO”调整,我们大约在一年前不幸被说服进行了该调整(相关讨论)。该调整现已回退,并已反向移植到稳定版。