静的サイトのHTMLアーカイブ作成、最適な方法についての最新情報は？

justin_gordon · 2025 年 7 月 10 日午後 11:10

更新！

これが答えかもしれません：

以下を確認しました：

これは古い情報です。

https://forum.talksurf.com/ を廃止する予定です。

はい、バックアップをアーカイブするつもりです。

しかし、閲覧可能なHTMLファイルだけが必要な場合はどうすればよいですか？

https://github.com/kitsabdkats/ArchiveDiscourse/blob/master/archive-discourse.py を実行するだけでよいでしょうか？

それとも、もっと良い方法がありますか？

よろしくお願いします！

CC: @pfaffman
アロハ、
ジャスティン

NateDhaliwal · 2025 年 7 月 10 日午後 11:19

ウェイバック・マシン（Wayback Machine）のようなものは、似たようなものでしょうか？

justin_gordon · 2025 年 7 月 11 日午前 12:00

これで動作しました。わずかなコードの更新が必要でした。

pfaffman · 2025 年 7 月 11 日午後 10:36

あなたのDiscourseのバージョンほど古くはありません！

wgetでサイトをミラーリングして、ある程度の成果を上げてきました。以下のようなコマンドです。

wget --mirror --page-requisites --convert-links --adjust-extension --compression=auto --reject-regex "/search" --no-if-modified-since --no-check-certificate --execute robots=off --random-wait --wait=1 --user-agent="Googlebot/2.1 (+http://www.google.com/bot.html)" --no-cookies --header "Cookie: _t=$COOKIE" https://forum.talksurf.com/

ただし、_tという名前のCookieを取得する必要があります。

メールを送っていただければ、できることを確認します。

翔_贺 · 2025 年 7 月 14 日午前 1:50

最近これをやっていて、そのやり方はこうです。

 def serve
    file_path = File.expand_path(
      params[:path]+"."+params[:format],
      File.join(File.dirname(__FILE__), "../../public")
    )
    if File.file?(file_path)
      send_file file_path, type: "text/html", disposition: "inline"
    else
      render plain: "404 Not Found", status: 404
    end
  end

justin_gordon · 2025 年 7 月 15 日午前 12:11

お知らせですが、これは新しいURLで画像を取得するものではありません。写真は引き続きサーバー（まもなく廃止される予定です！）を指します。

justin_gordon · 2025 年 7 月 15 日午前 12:18

ジェイさんが親切にダンプを送ってくれたので、私のものと比較しました。

彼のテクニックは、画像を保存するという点でより優れています。

しかし、彼の内部リンクは記事ではなく、廃止されたサイトを指しています。ただし、記事は画像と一緒に見つけることができます。

Discourseが静的エクスポートをサポートしていると「あれば嬉しい」ですね。

supermathie · 2025 年 7 月 15 日午前 12:26

良い点は、すべてのデータが手元にあるため、誰かがその気になればバックアップから直接データをエクスポートするものが書けるということです。

しかし、私たちが書く可能性は低いです

pfaffman · 2025 年 7 月 15 日午前 12:52

内部リンクの修正はそれほど難しくないはずです。.html を追加するだけでよいようです

トピック		返信	表示
Improving Discourse static HTML archive Feature	5	2022	2019 年 4 月 7 日
How do I export the complete forum as static html pages? Support	4	2865	2022 年 5 月 11 日
Archive an old forum "in place" to start a new Discourse forum Migrating to Discourse	0	19412	2014 年 3 月 5 日
Archiving an inactive discourse forum Support	6	1158	2022 年 1 月 28 日
A basic Discourse archival tool Dev	24	14134	2025 年 4 月 30 日

静的サイトのHTMLアーカイブ作成、最適な方法についての最新情報は？

関連トピック