Discourse 公開データダンプ

AIの登場とローカル開発マシンでの大規模データセットの必要性を考慮し、Discourseフォーラムからすべての公開(匿名ユーザーに表示可能)データを「動作可能な」コピーを取得するための簡単なパターンをまとめました。

ドキュメントの最新情報は以下で管理しています。

なぜ気にするのか?

  • 大量のトピックを含むローカルデータベースが欲しい
  • システムに個人データを一切置きたくない

これはまだ非常に荒削りな状態ですが、初期の実験には十分機能し、非常に人口密度の高いローカル環境を提供します。


このドキュメントはバージョン管理されています。変更はgithubで提案してください。

「いいね!」 21

こんにちは、この仕事をありがとうございます。私はDiscourse APIにかなり新しいのですが、試してみたいと思います。read meファイルからすると、topic_queryとpost_queryがこのリポジトリの重要なドキュメントのようです。__これらのファイルをカスタマイズして、目的のダンプに適応させることは可能ですか?__例えば、特定のカテゴリやタグのトピックだけをダンプしたい場合です。ありがとうございます。