Question pour les collègues de la data ici

Je recherche la documentation/la logique sur la façon dont les métriques dans la section d’administration de notre site Discourse sont définies (utilisateurs de différents niveaux de confiance, vues, vues de robots d’exploration spécifiquement).

Je suis un ingénieur de données dont l’entreprise (Bubble.io) héberge elle-même un forum Discourse. Je suis administrateur sur ce site. Nous extrayons actuellement toutes les données Discourse via un outil ETL fiable de l’industrie appelé Stitch. Mon problème est que les données que je vois dans mon entrepôt de données dans le schéma approprié ne correspondent pas à ce que Discourse rapporte dans sa section d’administration, j’essaie donc de trouver une documentation sur la façon dont ces métriques sont calculées.

Par exemple, Discourse me dit que j’ai 56 000 utilisateurs de niveau de confiance 0. Qu’est-ce que ce nombre ? Comment le définissent-ils ? Il ne correspond pas aux données que je vois pour les utilisateurs uniques, les utilisateurs enregistrés, les adresses IP uniques, les noms d’utilisateur uniques, les e-mails uniques, etc.

En ce qui concerne les vues de page, Discourse signale des chiffres radicalement différents de ceux de la table TOPIC_VIEWS que j’obtiens via Stitch. Et, comment Discourse définit-il une vue de page normale par rapport à une vue de page de robot d’exploration ? Il n’y a pas de métadonnées dans la table TOPIC_VIEWS qui définissent chaque type de vue de page.

Toute aide que vous pourrez apporter sera appréciée.

1 « J'aime »

Je ne suis pas sûr si ceux-ci sont utiles mais il y a :

2 « J'aime »