鉴于人工智能的出现以及在本地开发机器上需要大型数据集,我们整理了一个快速的模式,用于获取 Discourse 论坛上所有公开(匿名可见)数据的“可用”副本。
保持文档最新:
你为什么关心?
- 你想要一个包含大量主题的本地数据库
- 你不想在你的系统上保留任何个人数据
这仍然处于非常粗糙的状态,但对于初步实验来说是可行的,并且可以为你提供一个人口稠密的本地设置。
本文档已进行版本控制 - 请在 github 上建议更改。
21 个赞
bigkid
(Manuel Pueyo)
2
你好,感谢您这项工作,我对Discourse API还挺新,但我想试一试。从自述文件来看,topic_query和post_query似乎是这个仓库中的关键文档。__你知道我们是否可以自定义这些文件以适应我们想要的导出内容吗?__比如我们只想导出特定类别或标签的主题。谢谢