RSS URL 在 Google Console 中显示 403 错误

即使在删除主题后,Google 仍在抓取 RSS 源,并返回 403 状态码而非 404。

请在“覆盖率”部分找到报告:排除 > “因访问被禁止而阻止(403)”

当主题被删除时,会显示此消息:“哎呀!该页面不存在或为私有。”(图 1)

当检查同一已删除 URL 的 RSS 源时,会显示:“抱歉,我们无法加载该主题,可能是连接问题。请重试。如果问题持续存在,请告知我们。”(图 2)

示例 URL:
https://meta.discourse.org/t/how-to-add-new-users-to-specific-groups/110875

示例 RSS URL:
https://meta.discourse.org/t/how-to-add-new-users-to-specific-groups/110875.rss

如果上述示例 URL 被删除,则 RSS URL 将显示“图 2”中的消息。

如果我理解有误,请纠正我。

该主题并未被删除。你在这里具体是在报告什么问题?

1 个赞

我认为她的意思是,当她删除一个主题时,正常的主题 URL 会按预期返回 404 错误,但关联的 .rss URL 却返回 403 错误,这会让 Google 的网络爬虫感到困惑。

1 个赞

是的,在以下路径中发现的 .rss 网址显示的是 403 错误,而非 404 错误。

Google Search Console > 覆盖范围 > 已排除 > “因访问被禁止而排除(403)”

在此处添加 pr-welcome 标签。

2 个赞

考虑到我们最近与Google的那些小插曲,也许我们应该优先处理这个问题,@sam。我觉得这应该不难?主题返回404错误,RSS源也应该如此。

2 个赞

明白了,@vinothkannans,你能修复一下,让已删除主题的 .rss 在删除后返回 404 错误吗?

这已经在以下提交中修复:

2 个赞