我想导出所有帖子进行分析

是否有办法导出所有社区帖子数据?

我想对社区活动指标进行深入分析:

  1. 首次响应时间
  2. 转帖至解决时间
  3. 解决时间
  4. 重新分配至解决时间
1 个赞

我推荐使用数据浏览器插件。它可以执行您所需的部分分析,并导出您需要的任何数据。

2 个赞

谢谢!

这太棒了!

1 个赞

有人有这份查询可以分享吗?另外,有没有办法导出每篇已发布帖子的原始文本?

谢谢!

你看过示例查询了吗?

select id post_id,raw from posts

1 个赞

这也会包含 PM 和已删除的帖子,而他可能并不想要这些。

@401Ott,如果你想要所有不包含私信的已发布帖子,那么你需要过滤掉话题类型(archetype)为 ‘private_message’ 的帖子。

此外,如果你不想要已删除的帖子,你需要过滤掉 deleted_at 不为 NULL 的帖子。但由于某些帖子会因其所属话题被删除而一并被删除,你还必须过滤掉所属话题具有 deleted_at 时间戳的帖子。

如果你需要确切的查询语句,请具体说明你的需求,我会为你编写。

1 个赞

是的,我认为只筛选公开且已发布的帖子确实是最理想的方案。在一个完美的导出中,我希望包含用户名、创建日期(帖子)、创建时间以及帖子的正文内容。如果还能附带相关标签就更好了。

总的来说,我的目标是能够识别某个特定的 URL 路径在我的社区中被分享的时机和频率。我希望将所有帖子文本导出为 .csv 文件会有所帮助。

非常感谢你的协助,@JusticeUK。如果这个目标不切实际,也请告诉我(如果不现实也没关系 :grinning_face_with_smiling_eyes:)。

最简单快捷的方法是:

select post_id, user_id, created_at, raw, cooked from badge_posts where deleted_at is null

from posts 替换为 from badge_posts。该查询已自动过滤为仅包含公开帖子。

2 个赞

文档的缺失在此处令人颇为沮丧,因为我之前并不了解 badge_posts,导致几周前编写的查询都明确将私信从帖子中过滤掉了。