コミュニティの投稿データをすべてエクスポートする方法はありますか?
コミュニティ活動の指標について詳細な分析を行いたいと考えています。
- 初回回答までの時間
- リポストから解決までの時間
- 解決までの時間
- 再アサインから解決までの時間
コミュニティの投稿データをすべてエクスポートする方法はありますか?
コミュニティ活動の指標について詳細な分析を行いたいと考えています。
データエクスプローラープラグインをお勧めします。ご希望の分析の少なくとも一部を実行でき、必要なデータを任意の形式でエクスポートできます。
ありがとうございます!
これ、すてきですね!
このクエリをお持ちの方はいらっしゃいますか?また、投稿された各投稿の生テキストをエクスポートする方法はありますか?
ありがとうございます!
サンプルクエリをご覧になりましたか?
select id post_id,raw from posts
それでは、PM(プライベートメッセージ)や削除された投稿も含まれてしまう可能性があります。おそらく、それは望んでいないでしょう。
@401Ott さん、プライベートメッセージを除くすべての公開投稿を取得したい場合は、トピックのアーキタイプが ‘private_message’ である投稿を除外する必要があります。
さらに、削除された投稿も除外したい場合は、deleted_at が NULL ではない投稿を除外する必要があります。ただし、トピック自体が削除されたために投稿が削除される場合もあるため、その投稿が属するトピックの deleted_at タイムスタンプがある投稿も除外する必要があります。
正確なクエリが必要な場合は、具体的に何が必要か明記してください。作成いたします。
はい、公開された投稿のみをフィルタリングするのが理想的だと私も思います。完璧なエクスポートでは、ユーザー名、投稿の作成日、作成時刻、投稿本文が必要です。関連するタグもあればさらに良いですね。
私の主な目的は、コミュニティ内で特定の URL パスがいつ、どれくらいの頻度で共有されているかを把握することです。すべての投稿本文を CSV 形式で入手できれば、それが役立ってくれると期待しています。
@JusticeUK さん、お手伝いいただきありがとうございます。もしこの目標が非現実的であれば、その旨をお知らせください(そうでなくても全く問題ありません
)。
これを行う最も簡単で迅速な方法は、from posts の代わりに from badge_posts を使用して、select post_id, user_id, created_at, raw, cooked from badge_posts where deleted_at is null とすることです。これはすでに公開投稿にのみフィルタリングされています。
ドキュメントが不足している点が非常にイライラさせられます。badge_posts の存在を知らなかったため、数週間前に作成したクエリはすべて、投稿からダイレクトメッセージを明示的に除外するようになっています。