Discourse 公共数据转储

鉴于人工智能的出现以及在本地开发机器上需要大型数据集的需求,我们整理了一个快速方案,用于从 Discourse 论坛获取所有公开(匿名用户可见)数据的“可用”副本。

文档的最新版本请参见:

您为什么关心?

  • 您想要一个包含大量主题的本地数据库
  • 您不希望系统上存在任何个人数据

这仍处于非常粗略的阶段,但对于初步实验来说是可行的,并能为您提供一个非常庞大的本地设置。


本文档是版本控制的 - 请在 GitHub 上建议更改。

21 个赞

你好,感谢您这项工作,我对Discourse API还挺新,但我想试一试。从自述文件来看,topic_query和post_query似乎是这个仓库中的关键文档。__你知道我们是否可以自定义这些文件以适应我们想要的导出内容吗?__比如我们只想导出特定类别或标签的主题。谢谢