Bing正在抓取每个帖子的RSS feed,我可以在Discourse中禁用feed吗

所以,我正在为一个使用子域名的网站搭建 Discourse 论坛,我注意到 Bing 正在抓取每个帖子和分类的 RSS 源,并将其收录到站点地图部分。

这是预期的行为吗?
我是否应该禁用论坛的 RSS 源以防止这种情况发生?
Discourse 中是否有禁用 RSS 源的方法?

6 个赞

不是。RSS 源包含 noindex 标头,Bing 理应遵守。请参阅

以及

无法做到这一点(除非将整个网站设置为需要登录,但这会禁用所有索引。)

您是在实际的 Bing 搜索结果中看到 RSS 页面,还是仅在他们的站长工具中看到?

10 个赞

有没有办法确认 noindex 是否出现在源订阅中?我之所以这么问,是因为我甚至在 RSS 源代码中都找不到 noindex 标签。例如,我也用 .rss 格式打开了这个论坛帖子,但在源代码中同样找不到 noindex。

到目前为止,我只在站长工具的站点地图部分(位于订阅分组下)看到了这些源订阅。

谢谢,

3 个赞

当然。以下步骤假设您使用的是 Google Chrome,但其他浏览器也可参考类似流程。

  1. 打开开发者工具面板 F12
  2. 切换到“网络”(Network)选项卡。
  3. 加载一个 RSS 源,例如本主题:https://meta.discourse.org/t/bing-is-picking-all-the-rss-feed-for-each-post-can-i-disable-the-feed-in-discourse/168025.rss
  4. 在列表中选择该 RSS 源条目。
  5. 查看“标头”(Headers)选项卡中的响应标头,您应该能看到 x-robots-tag: noindex
10 个赞

谢谢,我确实看到了 x-robots-tag: noindex。但我还是不明白,既然设置了 noindex 标签,Bing 为什么还会抓取 RSS?

5 个赞

欢迎来到“激动人心的必应世界”™!

我真希望我能说自己感到惊讶。我真的非常非常希望如此。

6 个赞

试图追赶谷歌吗?:slightly_smiling_face:

4 个赞

我假装你没有在讽刺。:stuck_out_tongue_closed_eyes:

不,他们已经赶上了,但在正确索引 Discourse 论坛方面,他们还有很长的路要走。

2 个赞

大家好!很抱歉给大家带来这么多麻烦。我将把这个帖子转发给 Bing 团队的其他成员。Bing 本不应索引带有 noindex 元标签的 RSS,因此这很可能是一个 bug 或抓取问题。感谢大家的报告!

预计这个问题将在几小时内得到修复。届时我会回到这个帖子并发布确认信息。如果我们遇到一些困难,我会通过私信与发帖人(OP)进一步沟通。再次感谢大家。

5 个赞

Frédéric 已向我介绍了这里的情况以及正在发生的事情。在他忙于处理其他不得不优先关注的事务期间,我代表他发言。:slight_smile:

目前看来,我们已经掌握了问题的关键。正如 Frédéric 所说,我已直接私信了 @mhwebee,并将私下继续处理此事。如果您能关闭该线程,那就太好了!

我及必应开发团队向您致以诚挚的问候,

Jordi

5 个赞