Discourse 公開データダンプ

AIの登場と、ローカル開発マシン上で大規模なデータセットが必要になることを踏まえ、Discourseフォーラムからすべての公開(匿名ユーザーに見える)データの「実用的な」コピーを取得するための簡単なパターンをまとめました。

ドキュメントの最新情報は以下で管理しています。

なぜこれが重要なのか?

  • 非常に多くのトピックを含むローカルデータベースが欲しい
  • システム上に個人情報を一切置きたくない

これはまだ非常に粗い状態ですが、初期の実験には実用的であり、非常に多くのデータを持つローカル環境を提供します。


このドキュメントはバージョン管理されています。変更の提案はGitHubで行ってください。

「いいね!」 21

こんにちは、この仕事をありがとうございます。私はDiscourse APIにかなり新しいのですが、試してみたいと思います。read meファイルからすると、topic_queryとpost_queryがこのリポジトリの重要なドキュメントのようです。__これらのファイルをカスタマイズして、目的のダンプに適応させることは可能ですか?__例えば、特定のカテゴリやタグのトピックだけをダンプしたい場合です。ありがとうございます。