Discourse 公共数据转储

鉴于人工智能的出现以及在本地开发机器上需要大型数据集,我们整理了一个快速的模式,用于获取 Discourse 论坛上所有公开(匿名可见)数据的“可用”副本。

保持文档最新:

你为什么关心?

  • 你想要一个包含大量主题的本地数据库
  • 你不想在你的系统上保留任何个人数据

这仍然处于非常粗糙的状态,但对于初步实验来说是可行的,并且可以为你提供一个人口稠密的本地设置。


本文档已进行版本控制 - 请在 github 上建议更改。

21 个赞

你好,感谢您这项工作,我对Discourse API还挺新,但我想试一试。从自述文件来看,topic_query和post_query似乎是这个仓库中的关键文档。__你知道我们是否可以自定义这些文件以适应我们想要的导出内容吗?__比如我们只想导出特定类别或标签的主题。谢谢