Gibt es Neuigkeiten zum besten Weg, ein HTML-Archiv einer statischen Website zu erstellen?

justin_gordon · 10. Juli 2025 um 23:10

Update!

Das könnte die Antwort sein:

Ich habe mir angesehen:
Improving Discourse static HTML archive.
Das ist alt.

Ich werde https://forum.talksurf.com/ archivieren.

Ja, ich werde ein Backup archivieren.

Aber was, wenn ich nur einige durchsuchbare HTML-Dateien möchte?

Soll ich einfach ArchiveDiscourse/archive-discourse.py at master · kitsandkats/ArchiveDiscourse · GitHub ausführen?

Oder gibt es etwas Besseres?

Danke im Voraus!

CC: @pfaffman
Aloha,
Justin

NateDhaliwal · 10. Juli 2025 um 23:19

Wäre so etwas wie die Wayback Machine ähnlich?

justin_gordon · 11. Juli 2025 um 00:00

Das hat funktioniert. Ich musste eine kleine Codeaktualisierung vornehmen.

pfaffman · 11. Juli 2025 um 22:36

Aber nicht viel älter als deine Discourse-Version!

Ich hatte etwas Erfolg beim Spiegeln von Websites mit wget. Etwas wie

wget --mirror --page-requisites --convert-links --adjust-extension --compression=auto --reject-regex "/search" --no-if-modified-since --no-check-certificate --execute robots=off --random-wait --wait=1 --user-agent="Googlebot/2.1 (+http://www.google.com/bot.html)" --no-cookies --header "Cookie: _t=$COOKIE" https://forum.talksurf.com/

Aber du musst den Cookie namens _t bekommen.

Schick mir eine E-Mail und ich werde sehen, was ich tun kann.

翔_贺 · 14. Juli 2025 um 01:50

Ich mache das seit kurzem, und so habe ich es gemacht。

 def serve
    file_path = File.expand_path(
      params[:path]+"."+params[:format],
      File.join(File.dirname(__FILE__), "../../public")
    )
    if File.file?(file_path)
      send_file file_path, type: "text/html", disposition: "inline"
    else
      render plain: "404 Not Found", status: 404
    end
  end

justin_gordon · 15. Juli 2025 um 00:11

Nur damit Sie Bescheid wissen, dies zieht die Bilder nicht mit neuen URLs. Die Fotos werden immer noch auf Ihren Server verweisen (der bald außer Betrieb genommen wird!).

justin_gordon · 15. Juli 2025 um 00:18

Jay hat mir freundlicherweise den Dump geschickt, und ich habe ihn mit meinem verglichen.

Seine Technik funktioniert besser, da sie die Bilder speichert.

Seine internen Links verweisen jedoch nicht auf die Artikel, sondern auf die stillgelegte Website. Die Artikel können jedoch mit Bildern gefunden werden.

Es wäre ein “nice to have”, wenn Discourse einen statischen Export unterstützen würde. .

supermathie · 15. Juli 2025 um 00:26

Das Gute ist, dass Sie alle Daten haben, sodass man einen schreiben könnte, der die Daten direkt aus einem Backup exportiert, wenn jemand die Neigung dazu hätte.

Aber wir werden wahrscheinlich keinen schreiben

pfaffman · 15. Juli 2025 um 00:52

Es sollte nicht zu schwer sein, die internen Links zu reparieren. Es sieht so aus, als müssten sie nur um .html ergänzt werden.

manuel · 16. April 2026 um 18:32

Ich hätte immer noch gerne einen guten Archiv-Generator für Discourse.

Lass Claude es einfach einmal ausprobieren. Ich teile dies hier zur Referenz und halte dieses Feature im Blick:

Bisher ist es eine grundlegende Einrichtung: Themen, Kategorien, Tags und Benutzer. Die Suche funktioniert ebenfalls. Ich habe ein Archiv einer lokalen Demo-Instanz auf einer GitHub-Seite hochgeladen:

pfaffman · 16. April 2026 um 19:05

Das ist wahrscheinlich besser als das.

Fügen Sie dies ein, um das Cookie auf COOKIE zu setzen, und fügen Sie dann die Cookies ein, die von der Cooke Chrome-Erweiterung in die Zwischenablage kopiert wurden.


COOKIE=$(cat |jq -r '.[ ]|select(.name == "\_t")|.value')

Geben Sie hier die URL ein:

und fügen Sie dann Folgendes ein:


wget --mirror --page-requisites --convert-links --adjust-extension --compression=auto --reject-regex "/search" --no-if-modified-since --no-check-certificate --execute robots=off --random-wait --wait=1 --user-agent="Googlebot/2.1 (+http://www.google.com/bot.html)" --no-cookies --header "Cookie: \_t=$COOKIE" =FORUMURL=

Thema		Antworten	Aufrufe
Improving Discourse static HTML archive Feature	5	2114	7. April 2019
How do I export the complete forum as static html pages? Support	3	2997	11. Mai 2022
Archiving an inactive discourse forum Support	4	1225	31. Mai 2016
Archive an old forum "in place" to start a new Discourse forum Migrating to Discourse	0	19620	5. März 2014
A basic Discourse archival tool Development	24	14607	30. April 2025

Gibt es Neuigkeiten zum besten Weg, ein HTML-Archiv einer statischen Website zu erstellen?

Verwandte Themen