Des nouvelles sur la meilleure façon de créer une archive HTML d'un site statique ?

Mise à jour !

C’est peut-être la réponse :

J’ai regardé :
Improving Discourse static HTML archive.
C’est vieux.

Je vais retirer https://forum.talksurf.com/.
Oui, je vais archiver une sauvegarde.

Mais que faire si je veux juste quelques fichiers HTML consultables ?

Dois-je simplement exécuter ArchiveDiscourse/archive-discourse.py at master · kitsandkats/ArchiveDiscourse · GitHub ?

Ou y a-t-il quelque chose de mieux ?

Merci d’avance !

CC : @pfaffman
Aloha,
Justin

Quelque chose comme la Wayback Machine serait-il similaire ?

Cela a fonctionné. J’ai dû faire une légère mise à jour du code.

3 « J'aime »

Mais pas beaucoup plus vieux que votre version de Discourse !

J’ai eu un peu de succès en miroir de sites avec wget. Quelque chose comme

wget --mirror --page-requisites --convert-links --adjust-extension --compression=auto --reject-regex "/search" --no-if-modified-since --no-check-certificate --execute robots=off --random-wait --wait=1 --user-agent="Googlebot/2.1 (+http://www.google.com/bot.html)" --no-cookies --header "Cookie: _t=$COOKIE" https://forum.talksurf.com/

Mais vous devez obtenir le cookie nommé _t

Envoyez-moi un e-mail et je verrai ce que je peux faire.

1 « J'aime »

Je fais cela récemment, et voici comment j’ai procédé.

 def serve
    file_path = File.expand_path(
      params[:path]+"."+params[:format],
      File.join(File.dirname(__FILE__), "../../public")
    )
    if File.file?(file_path)
      send_file file_path, type: "text/html", disposition: "inline"
    else
      render plain: "404 Not Found", status: 404
    end
  end

Pour information, cela ne récupère pas les images avec de nouvelles URL. Les photos pointeront toujours vers votre serveur (qui est sur le point d’être mis hors service !).

Jay m’a gentiment envoyé le dump, et je l’ai comparé au mien.

Sa technique fonctionne mieux dans le sens où elle enregistre les images.

Cependant, ses liens internes ne pointent pas vers les articles, mais plutôt vers le site désaffecté. Cependant, les articles peuvent être trouvés avec les images.

Ce serait un « agréable à avoir  » si Discourse prenait en charge une exportation statique. :smile:.

2 « J'aime »

La bonne chose est que vous avez toutes les données, donc on pourrait en écrire une qui exporterait les données directement à partir d’une sauvegarde si quelqu’un avait l’envie de le faire.

Mais nous n’allons probablement pas en écrire une :wink:

1 « J'aime »

Il ne devrait pas être trop difficile de corriger les liens internes, il semble qu’il suffise d’ajouter .html