Gibt es Neuigkeiten zum besten Weg, ein HTML-Archiv einer statischen Website zu erstellen?

Update!

Das könnte die Antwort sein:

Ich habe mir angesehen:
Improving Discourse static HTML archive.
Das ist alt.

Ich werde https://forum.talksurf.com/ archivieren.

Ja, ich werde ein Backup archivieren.

Aber was, wenn ich nur einige durchsuchbare HTML-Dateien möchte?

Soll ich einfach ArchiveDiscourse/archive-discourse.py at master · kitsandkats/ArchiveDiscourse · GitHub ausführen?

Oder gibt es etwas Besseres?

Danke im Voraus!

CC: @pfaffman
Aloha,
Justin

Wäre so etwas wie die Wayback Machine ähnlich?

Das hat funktioniert. Ich musste eine kleine Codeaktualisierung vornehmen.

3 „Gefällt mir“

Aber nicht viel älter als deine Discourse-Version!

Ich hatte etwas Erfolg beim Spiegeln von Websites mit wget. Etwas wie

wget --mirror --page-requisites --convert-links --adjust-extension --compression=auto --reject-regex "/search" --no-if-modified-since --no-check-certificate --execute robots=off --random-wait --wait=1 --user-agent="Googlebot/2.1 (+http://www.google.com/bot.html)" --no-cookies --header "Cookie: _t=$COOKIE" https://forum.talksurf.com/

Aber du musst den Cookie namens _t bekommen.

Schick mir eine E-Mail und ich werde sehen, was ich tun kann.

1 „Gefällt mir“

Ich mache das seit kurzem, und so habe ich es gemacht。

 def serve
    file_path = File.expand_path(
      params[:path]+"."+params[:format],
      File.join(File.dirname(__FILE__), "../../public")
    )
    if File.file?(file_path)
      send_file file_path, type: "text/html", disposition: "inline"
    else
      render plain: "404 Not Found", status: 404
    end
  end

Nur damit Sie Bescheid wissen, dies zieht die Bilder nicht mit neuen URLs. Die Fotos werden immer noch auf Ihren Server verweisen (der bald außer Betrieb genommen wird!).

Jay hat mir freundlicherweise den Dump geschickt, und ich habe ihn mit meinem verglichen.

Seine Technik funktioniert besser, da sie die Bilder speichert.

Seine internen Links verweisen jedoch nicht auf die Artikel, sondern auf die stillgelegte Website. Die Artikel können jedoch mit Bildern gefunden werden.

Es wäre ein “nice to have”, wenn Discourse einen statischen Export unterstützen würde. :smile:.

2 „Gefällt mir“

Das Gute ist, dass Sie alle Daten haben, sodass man einen schreiben könnte, der die Daten direkt aus einem Backup exportiert, wenn jemand die Neigung dazu hätte.

Aber wir werden wahrscheinlich keinen schreiben :wink:

1 „Gefällt mir“

Es sollte nicht zu schwer sein, die internen Links zu reparieren. Es sieht so aus, als müssten sie nur um .html ergänzt werden.