「ユーザー参加統計」クエリからの統計の一貫性のなさ

なぜ私のレポートは数ヶ月間同じ結果で実行されているのですか?コミュニティの設立以来の活動に基づいたレポートを実行しています。コミュニティはこの間ずっとますます活発になっています。

たとえば、あるユーザーはクエリ結果で271件のトピックが表示されたと表示されていますが、プロフィール概要では1.2k件のトピックが表示されたと表示されています。

Metaでクエリを簡単に実行したところ、「duration」の値を変更すると統計情報が更新されるため、どこかでスタックしているようには見えません。また、90日間の期間で実行し、最近のアクティビティがその期間内に集中している新しいユーザーと比較しましたが、その統計情報は概要と一致しています。

再現できるかどうかを確認するために、他にチェックできることはありますか?

「いいね!」 1

何か明確にしていただけますか。

特定のユーザーのサインアップ日をテストとして、439日前からクエリを開始し、期間の日付も同じ日数に設定しようとしています。これにより、サインアップ以降のすべての参加データが含まれると思っていました。しかし、データがそれを反映していません。

これを達成するにはどうすればよいですか?

「いいね!」 1

また、439日前から現在までのユーザー参加統計クエリには、その時点で既に登録済みでアクティブだったメンバーのみが含まれているようです。その後登録され、その期間内にアクティブだったメンバーの参加データは含まれていません。

このレポートをカスタマイズして、必要なデータを取得できるように手伝ってもらえませんか?SQLは表面的なレベルしかわかりません。

「いいね!」 1

レポートを見ると、visits の順で、最も多いものが一番上に表示されているようです。そのため、選択した期間の途中で参加した人はリストの下の方に表示されることになります(表示されるリストは1000件に制限されていますが、結果をCSVとしてエクスポートすれば10,000件取得できると思います)。

ただし、カスタムクエリを作成することも可能です。:+1: 具体的にどのようなデータをお探しですか?

「いいね!」 1

まだそれほどのメンバーはいませんが、問題ありません。

やったー

明確にしていただきたい点として、各列がどのように計算されているかです。CSVとメンバーのプロフィール概要ページにあるものとの間に不一致があります(注意:クエリの日付がメンバーの登録ライフサイクルと一致するデータセットのみを比較しています)。

  1. クエリ期間中に参加したメンバー全員の参加統計(参加回数が1回以上の場合)。
  2. 新コミュニティ立ち上げからの累積参加状況を示すために、各月末に統計情報を取得。

:from_days_ago:duration_days のクエリ期間を考慮すると、それが生成されていたデータだと考えていました。

「いいね!」 1

今朝、詳しく調べてみましたが、もっと多くのことがわかるかもしれません。私の環境では、開始日(:slight_smile:)まで498日遡ろうとするとタイムアウトしてしまいますが、1年分のデータを取得できたので、ユーザー統計と比較することができます。 :+1: (数時間分のデータは多少の誤差があるかもしれません)

posts_createdtopics_createdlikes_givenlikes_received の両者間には違いがあります。SQLを詳しく見ると、ユーザー参加統計クエリでは削除された投稿、ウィスパー、またはプライベートメッセージが除外されていないようです。これが原因かもしれません。

topics_viewedposts_viewed は、どちらもかなり正確なようです。 :+1:

一部のユーザーが表示されない理由がわかりません。私が把握している唯一の除外基準は、その期間内に0件より多くの投稿を読んでいる必要があるということですが、これはステージングされたユーザーを除いて、ほとんどすべてのユーザーに当てはまるはずです。


pr AS (
    SELECT user_id, COUNT(1) AS visits,
        SUM(posts_read) AS posts_read
    FROM user_visits, t
    WHERE posts_read > 0
        AND visited_at > t.START
        AND visited_at < t.END
    GROUP BY
        user_id

さらに調査を続けて、もっと何か見つけられるようにします。 :slight_smile: :+1:

私の不一致は逆です。クエリ番号は、より大きくはなく、より小さいです。

:from_days_ago に 441 を、:duration_days に 441 を入力すると、これら (下記) が得られます。同じ期間のこのレポートと比較します (少なくとも…ハイライトされたユーザーの場合)。

今日から441日前まで遡るウィンドウが必要な場合、0と441にする必要があると思いますか?

:woman_facepalming:t4: あなたの返信の数分前に気づきました、ハハハ。忍耐強く対応していただきありがとうございます。

:from_days_ago を 0 に変更したところ、すべてがうまくいきました! :partying_face:

:duration_days に関して、私の脳は時系列で機能していたようです。:from_days_ago は、クエリがデータを取得し始める最初の日であり、その後、過去 441 日前、440 日前、439 日前というように、現在時刻まで時系列で機能すると考えていました。実際には、逆時系列順にデータを取得するようです。理解しました!

「いいね!」 1

ハハ。心配いりません。:slightly_smiling_face: そのレポートを勉強して多くのことを学んだので、それでもかなり役に立ちました。:slightly_smiling_face:

「いいね!」 2

This topic was automatically closed 30 days after the last reply. New replies are no longer allowed.