Frage an die Data-Leute hier

Ich suche nach Dokumentation/Logik, wie die Metriken im Admin-Bereich unserer Discourse-Seite definiert sind (Benutzer verschiedener Vertrauensstufen, Aufrufe, speziell Webcrawler-Aufrufe).

Ich bin ein Data Engineer, dessen Unternehmen (Bubble.io) ein Discourse-Forum selbst hostet. Ich bin ein Administrator dieser Seite. Wir ziehen derzeit alle Discourse-Daten über ein zuverlässiges Branchen-ETL-Tool namens Stitch. Mein Problem ist, dass die Daten, die ich in meinem Data Warehouse im entsprechenden Schema sehe, nicht mit dem übereinstimmen, was Discourse in seinem Admin-Bereich meldet. Daher versuche ich, einige Dokumentationen darüber zu finden, wie diese Metriken berechnet werden.

Zum Beispiel sagt mir Discourse, dass ich 56.000 Benutzer mit Vertrauensstufe 0 habe. Was ist diese Zahl? Wie definieren sie sie? Sie stimmt nicht mit den Daten überein, die ich für eindeutige Benutzer, registrierte Benutzer, eindeutige IPs, eindeutige Benutzernamen, eindeutige E-Mails usw. sehe.

Was die Seitenaufrufe betrifft, meldet Discourse völlig andere Zahlen als die TOPIC_VIEWS-Tabelle, die ich über Stitch erhalte. Und wie definiert Discourse einen normalen Seitenaufruf im Gegensatz zu einem Webcrawler-Seitenaufruf? In der TOPIC_VIEWS-Tabelle gibt es keine Metadaten, die jeden Seitentyp definieren.

Jede Hilfe, die Sie hier leisten können, wäre willkommen.

1 „Gefällt mir“

Ich bin mir nicht sicher, ob diese hilfreich sind, aber es gibt:

2 „Gefällt mir“