Ich suche nach Dokumentation/Logik, wie die Metriken im Admin-Bereich unserer Discourse-Seite definiert sind (Benutzer verschiedener Vertrauensstufen, Aufrufe, speziell Webcrawler-Aufrufe).
Ich bin ein Data Engineer, dessen Unternehmen (Bubble.io) ein Discourse-Forum selbst hostet. Ich bin ein Administrator dieser Seite. Wir ziehen derzeit alle Discourse-Daten über ein zuverlässiges Branchen-ETL-Tool namens Stitch. Mein Problem ist, dass die Daten, die ich in meinem Data Warehouse im entsprechenden Schema sehe, nicht mit dem übereinstimmen, was Discourse in seinem Admin-Bereich meldet. Daher versuche ich, einige Dokumentationen darüber zu finden, wie diese Metriken berechnet werden.
Zum Beispiel sagt mir Discourse, dass ich 56.000 Benutzer mit Vertrauensstufe 0 habe. Was ist diese Zahl? Wie definieren sie sie? Sie stimmt nicht mit den Daten überein, die ich für eindeutige Benutzer, registrierte Benutzer, eindeutige IPs, eindeutige Benutzernamen, eindeutige E-Mails usw. sehe.
Was die Seitenaufrufe betrifft, meldet Discourse völlig andere Zahlen als die TOPIC_VIEWS-Tabelle, die ich über Stitch erhalte. Und wie definiert Discourse einen normalen Seitenaufruf im Gegensatz zu einem Webcrawler-Seitenaufruf? In der TOPIC_VIEWS-Tabelle gibt es keine Metadaten, die jeden Seitentyp definieren.
Jede Hilfe, die Sie hier leisten können, wäre willkommen.