Domanda per i colleghi del settore dati

Sto cercando documentazione/logica su come vengono definite le metriche nella sezione di amministrazione del nostro sito Discourse (utenti di diversi livelli di fiducia, visualizzazioni, visualizzazioni di webcrawler in particolare).

Sono un data engineer la cui azienda (Bubble.io) ospita autonomamente un forum Discourse. Sono un amministratore su quel sito. Attualmente estraiamo tutti i dati di Discourse tramite uno strumento ETL affidabile del settore chiamato Stitch. Il mio problema è che i dati che vedo nel mio data warehouse nello schema appropriato non corrispondono a ciò che Discourse riporta nella sua sezione di amministrazione, quindi sto cercando di individuare della documentazione su come vengono calcolate queste metriche.

Ad esempio, Discourse mi dice che ho 56.000 utenti di livello di fiducia 0. Cos’è quel numero? Come lo definiscono? Non corrisponde ai dati che vedo per utenti unici, utenti registrati, IP unici, nomi utente unici, email uniche, ecc.

Per quanto riguarda le visualizzazioni di pagina, Discourse riporta numeri molto diversi rispetto alla tabella TOPIC_VIEWS che ottengo tramite Stitch. E come definisce Discourse una visualizzazione di pagina normale rispetto a una visualizzazione di pagina di webcrawler? Non ci sono metadati nella tabella TOPIC_VIEWS che definiscono ogni tipo di visualizzazione di pagina.

Qualsiasi aiuto che puoi fornire qui sarebbe apprezzato.

1 Mi Piace

Non sono sicuro che questi siano utili, ma ci sono:

2 Mi Piace