jbrains
(J. B. Rainsberger)
1
皆さん、こんにちは。Discourseサイトでコンテンツをアーカイブする方法を検討しています。WARCを作成して提供するというスレッドを見つけ、それを参考にできるのですが、すべてのトピック/スレッド/その他をMarkdownとしてエクスポートしたいと考えています。
これを読みました:Export topic as markdown
さて、すべてのトピックURLを反復処理して、それらを/raw/ URLに変換し、すべてのトピックをMarkdownとしてダウンロードする方法を知りたいです。サイト上のすべてのトピックURLのリストを取得する簡単な方法があれば教えてください。Railsコンソールを開く必要がありますか?すべてのトピックURLを列挙できる単一のRubyクラスはありますか?何か?
よろしくお願いします。
「いいね!」 1
jbrains
(J. B. Rainsberger)
2
そこに着きましたが、もっと簡単な方法があればぜひ聞きたいです。
- Discourse管理機能を使用してサイトのバックアップをダウンロードします。
- バックアップファイル内にあるPostgreSQLデータベースダンプを見つけ、それをローカルデータベースに復元します。
select id from topics を実行し、その結果をファイルに貼り付けます。
sed またはそれに類するコマンドを使用して、トピックIDを https://my-discourse-site/raw/<topic ID> に変換します。
for...; do wget $url; done を使用します。
jbrains
(J. B. Rainsberger)
4
これをカテゴリで反復処理するにはどうすればよいですか?
RGJ
(Richard - Communiteq)
5
/site.json をリクエストし、categories 配列を反復処理します。
「いいね!」 1