使用新网站流量报告实现更好的页面浏览量指标

我们很高兴地宣布,我们在处理 pageviews(页面浏览量)和向您展示这些关键数据方面取得了重大改进。我们全新的网站流量报告提供了对您社区参与度更全面、更准确的视图。让我们深入了解一下新内容以及它将如何使您受益!

:information_source: 请注意,我们正在逐步为托管客户推出新的 pageview(页面浏览量)跟踪功能,因此并非所有网站都会立即切换。

变化之处

我们改进了 pageview(页面浏览量)的跟踪和报告方法,为您提供更可靠、更具可操作性的数据。我们现在会监控 individual pageviews(单个页面浏览量)的来源,并能检测它们是来自真实浏览器还是爬虫。

全新的网站流量报告结合了来自各种来源的数据,为您提供网站流量的整体视图。

报告包含内容

网站流量报告包含以下四种 pageviews(页面浏览量):

  1. Pageviews (logged in)(已登录的页面浏览量): 来自登录到您的 Discourse 实例的用户的 pageviews(页面浏览量)。
  2. Pageviews (anonymous)(匿名页面浏览量): 来自未登录但正在使用网页浏览器的用户的 pageviews(页面浏览量)。
  3. Known crawlers(已知爬虫): 来自已识别的网页爬虫或机器人的 pageviews(页面浏览量)(例如,搜索引擎爬虫)。
  4. Other traffic(其他流量): 不属于其他三类请求的各种请求,包括其他爬虫。

默认报告视图会隐藏已知爬虫和其他流量指标,以便与仪表板其他位置显示的 pageview(页面浏览量)指标保持一致。

重要性

这现在为您提供了对论坛实际流量[1]更准确的衡量。
许多爬虫很难通过用户代理字符串轻松检测到,因此本报告有助于您更清晰地了解谁在访问您的论坛。

这使得您可以做出更好的决策,更轻松地跟踪增长,并提高识别用户和 pageviews(页面浏览量)趋势的能力。

:information_source: 对于托管客户而言,这意味着计算您月度限额的 pageviews(页面浏览量)也更加准确和现实。

如何访问新报告

您可以在管理员仪表板中找到新的合并 pageviews(页面浏览量)报告。有关如何解释和充分利用此新报告的详细指南,请参阅我们的综合文档:Understanding pageviews and the site traffic report

我们重视您的反馈

一如既往,我们致力于改善您使用 Discourse 的体验。我们很乐意听取您对这份新报告的看法,以及它如何帮助您更好地了解您的社区。请在下方的评论中分享您的反馈和任何疑问。


  1. 我们之前将这种新型流量称为 BPV 或 Browser Pageviews(浏览器页面浏览量)。目前任何使用“pageviews”(页面浏览量)的地方都指的是这种新类型。 ↩︎

36 个赞

在我两个自托管的安装中,都缺少大约 4 个月前的数据,尽管那个时期的数据仍然显示在其他图表中。您的报告中是否也出现了这种情况?

6 个赞

嘿 Jonah,你看到的情况是符合预期的,因为我们最近才开始以这种新格式收集数据。

其他人可能会有略微不同的体验,这取决于他们首次更新到开始以这种新格式收集流量数据的版本的时间。

其他数据不受此更改的影响,这就是为什么你看到的其他图表有更早的数据。

6 个赞

我认为至少应该将之前的登录数据和“其他流量”显示出来,以作历史记录之用。

10 个赞

我刚注意到这一点,它完全破坏了我们的页面浏览量统计数据,总浏览量减少了大约五分之一/六分之一。这应该被报告为错误吗?

正如 @JonahAragon1@darkpixlz 也指出的那样,我们现在已经丢失了多年的页面浏览量统计数据,包括自论坛开始以来的总数——这些能恢复吗?或者你们能否提供一个选项,让我们继续使用旧系统,无论是作为替代方案还是与这个新系统并行使用,直到任何初期问题得到解决?

4 个赞

说实话,这确实是一个很大的失误。不知道为什么当初没有考虑将其保留为“其他”,但现在就这样了。

4 个赞

不明白,所有信息都在。只需点击“其他”和“已知爬虫”,您就会看到之前看到的所有数字。

没有丢失任何信息,我们没有清除任何旧表,您仍然可以访问旧数据。

5 个赞

@AstonJ @darkpixlz 我刚刚合并了一个 PR,它会将旧的 pageview 和 consolidated pageview 报告分别显示为“Legacy Pageviews”和“Legacy Consolidated Pageviews”,希望这有帮助:

12 个赞

谢谢 Martin!

刚刚升级了两个论坛(3.4.0.beta3-dev),但是它们上面的 All reports | Legacy Pageviews 都是空的——你已经知道了这个问题吗?

3 个赞

抱歉,我不知道这个,谢谢告知,这是我的错。正在处理修复。

5 个赞

@AstonJ 问题是一个拼写错误,我刚刚合并了一个修复程序:

6 个赞

是否有办法了解更多关于“其他流量”来自哪里?

以下是我网站一天的页面浏览量:

算法 已登录 访客 爬虫 其他 总计
4348 7092 4430 - 15870
3954 1848 4430 5638 15870

据我理解,新旧算法的区别在于您学会了更好地区分真实匿名用户和爬虫代理。但是,为什么归因于已登录用户的页面浏览量会减少?另外,在同一天,我们有 1.6k 次来自搜索的访问,因此,这 1.6k 次访问仅产生 1.8k 次页面浏览量,这似乎有些难以置信?我想知道您对“其他流量”来自非人类的信心有多大。

另外,LLM 爬虫是计入“已知爬虫”还是“其他流量”?我在爬虫代理报告中没有看到任何,但也有可能是它们只是遵守了我的 robots.txt 设置[1]


  1. 如果它们遵守的话,我会感到惊讶 ↩︎

5 个赞

“其他流量”是什么意思? Support

这些访客是来自 Google、社交媒体和其他来源吗?

3 个赞

我认为这些通常会显示为匿名页面浏览量

3 个赞

谢谢 - 如果能知道“已知爬虫”的列表就好了……

Google
Bing
Yahoo
A
B
其他

4 个赞

目前我们没有更细粒度的数据来展示“其他流量”是什么。它只是任何非“真实/人类/浏览器”页面浏览量,无论是登录用户还是匿名用户,并且不是已知的爬虫。

我们相当有信心,但如今要将行为不端的机器人和爬虫与网站的合法用户区分开来是一场艰苦的战斗。未来我们可能需要对我们的系统进行进一步的调整。目前,如果整个 Ember 应用都已启动,我们会将该浏览量计为“真实”的,这在实际浏览器之外很难复制。

这取决于……有时它们会遵守 robots.txt 并将自己表示为爬虫,有时则不会,这也是页面浏览量如此膨胀的原因之一,我们才切换到这个新系统。

这是我们目前已知的爬虫,基于 User-Agent:

我们还对某些爬虫/机器人进行了速率限制,主要是 AI 机器人:

6 个赞

如果我们可以按地区/国家/地区可视化流量,那将是极好的。这对于规划本地化和翻译等功能非常有帮助。

1 个赞

如果你愿意,可以试试 Google Analytics。我相信它会显示来自不同国家的流量,并提供许多过滤器和指标。不过,这是 Google 的产品。

你也可以使用 Umami,它非常注重隐私,并且可以自行托管。

1 个赞