控制“其他流量”的巨大增长

你好。

谢谢,Discourse 非常棒。

我们有一个由 Discourse 为开源项目提供的论坛。它对我们的社区来说非常棒。几年来,我们的月浏览量一直保持在 20-40k 之间(除了需要限制 BingBot 的时候),但本周突然变得疯狂,每天有超过 8k 的访问量。

查看新的“浏览器检测合并页面浏览量”报告,似乎我们被“其他流量”淹没了。

是否有可以查看更详细信息的报告?有什么控制策略吗?

1 个赞

您可能想看看:

那里有一些不错的建议。

您可能还想看看这份报告:

(但这使用的是 Data Explorer 插件,我不确定您是否有)

4 个赞

您好 @julianstirling :wave: 欢迎 :)\n\n此主题也与解读页面浏览量相关:\n\nUnderstanding pageviews and the site traffic report

5 个赞

感谢 @NateDhaliwal@Lilly

我认为在托管选项中,我无法访问 Data explorer 插件或所有 IP。我们无法进行地理封锁,因为我们是一个非常国际化的社区。

很高兴听到:

我们主仪表板上的页面浏览量仍在使用旧视图,因此我们已远超配额:

看到这个峰值有点令人困惑/担忧。但我的理解是,要实际查看其他流量中包含哪些 IP 的底层日志,我们需要一个插件?

您好 Julian!抱歉这么晚才回复您。作为托管客户,您可以随时联系 team@discourse.org 以获得我们团队的个性化支持。我们也可以直接查看您网站的统计数据和设置,为您提供建议。

页面浏览量确实有所增长,而且您确实超出了限制。不过请放心,在与您沟通并帮助您回到限制范围内之前,我们不会向您收取额外费用。

1 个赞

您好 @julianstirling,

没有用于收集页面浏览量更详细信息的报告。Nate 链接了一个主题,其中解释了“其他流量”通常是什么:

并且回答这个问题:

我们不在任何报告中提供 IP 地址。作为托管客户,我们需要提取您的 Web 服务器日志。即便如此,我也会问您是否真的需要这些?

如果您担心页面浏览量限制,我建议您按照 Tobias 的说法联系我们的支持团队。

如果您想缓解其中一些请求,可以查看 Controlling Web Crawlers For a Site 。如那里所述,行为不端的机器人或爬虫(伪装成 Google 或 Bing 机器人)将无法通过该方法减速。

最后,如果您使用 Google Analytics,我们在一周多前发布了一个新指南:How to investigate bot traffic using Google Analytics 。如果您使用该指南,我们非常感谢您的任何反馈。

3 个赞

感谢 @MarkDoerr@tobiaseigen

虽然比之前高很多,但似乎开始平静下来了。希望这种趋势能继续下去。

当我们被必应(Bing)垃圾信息轰炸时,我们尝试过降低爬虫速度,但对于新的流量没有可识别的用户代理。而且,作为一个非常国际化的社区,我们无法进行地理封锁。

我不知道是否可以将 Google Analytics 接入,如果这成为一个真正的问题,我们可能需要考虑它。不过,这首先需要考虑社区的隐私。

目前,我将观察它是否会继续回归均值。

2 个赞