鉴于人工智能的出现以及在本地开发机器上需要大型数据集的需求,我们整理了一个快速方案,用于从 Discourse 论坛获取所有公开(匿名用户可见)数据的“可用”副本。
文档的最新版本请参见:
您为什么关心?
- 您想要一个包含大量主题的本地数据库
- 您不希望系统上存在任何个人数据
这仍处于非常粗略的阶段,但对于初步实验来说是可行的,并能为您提供一个非常庞大的本地设置。
本文档是版本控制的 - 请在 GitHub 上建议更改。
21 个赞
bigkid
(Manuel Pueyo)
2
你好,感谢您这项工作,我对Discourse API还挺新,但我想试一试。从自述文件来看,topic_query和post_query似乎是这个仓库中的关键文档。__你知道我们是否可以自定义这些文件以适应我们想要的导出内容吗?__比如我们只想导出特定类别或标签的主题。谢谢