我正在寻找关于我们的 Discourse 网站管理员部分中指标(不同信任级别的用户、浏览量、特别是网络爬虫浏览量)定义的文档/逻辑。
我是一名数据工程师,我所在的公司(Bubble.io)自行托管了一个 Discourse 论坛。我是该网站的管理员。我们目前通过一个可靠的行业 ETL 工具 Stitch 来提取所有 Discourse 数据。我的问题是,我在数据仓库中看到的相应架构中的数据与 Discourse 在其管理员部分报告的数据不匹配,因此我正在尝试查找有关这些指标如何计算的文档。
例如,Discourse 告诉我我有 56k 信任级别 0 的用户。这个数字是什么意思?他们是如何定义的?它与我看到的唯一用户、注册用户、唯一 IP、唯一用户名、唯一电子邮件等数据不匹配。
至于页面浏览量,Discourse 报告的数字与我通过 Stitch 获得的 TOPIC_VIEWS 表中的数字差异很大。而且,Discourse 是如何定义普通页面浏览量与网络爬虫页面浏览量的?TOPIC_VIEWS 表中没有定义每种页面浏览类型的元数据。
您能提供的任何帮助都将不胜感激。