¿Alguna actualización sobre la mejor manera de crear un archivo HTML de un sitio estático?

¡Actualización!

Esta podría ser la respuesta:

Miré:
Improving Discourse static HTML archive.

Es antiguo.

Voy a retirar https://forum.talksurf.com/.

Sí, voy a archivar una copia de seguridad.

¿Pero qué pasa si solo quiero algunos archivos HTML para navegar?

¿Debería simplemente ejecutar ArchiveDiscourse/archive-discourse.py at master · kitsandkats/ArchiveDiscourse · GitHub?

¿O hay algo mejor?

¡Gracias de antemano!

CC: @pfaffman
Aloha,
Justin

1 me gusta

¿Algo como Wayback Machine sería similar?

Esto funcionó. Tuve que hacer una pequeña actualización de código.

3 Me gusta

¡Pero no mucho más viejo que tu versión de Discourse!

He tenido algo de suerte reflejando sitios con wget. Algo como

wget --mirror --page-requisites --convert-links --adjust-extension --compression=auto --reject-regex "/search" --no-if-modified-since --no-check-certificate --execute robots=off --random-wait --wait=1 --user-agent="Googlebot/2.1 (+http://www.google.com/bot.html)" --no-cookies --header "Cookie: _t=$COOKIE" https://forum.talksurf.com/

Pero necesitas obtener la cookie llamada _t

Envíame un correo electrónico y veré qué puedo hacer.

1 me gusta

He estado haciendo esto recientemente, y así es como lo hice。

 def serve
    file_path = File.expand_path(
      params[:path]+"."+params[:format],
      File.join(File.dirname(__FILE__), "../../public")
    )
    if File.file?(file_path)
      send_file file_path, type: "text/html", disposition: "inline"
    else
      render plain: "404 Not Found", status: 404
    end
  end

Solo para informarte, esto no extrae las imágenes con nuevas URL. Las fotos seguirán apuntando a tu servidor (¡que está a punto de ser desmantelado!).

Jay amablemente me envió el volcado y lo comparé con el mío.

Su técnica funciona mejor en el sentido de que guarda las imágenes.

Sin embargo, sus enlaces internos no apuntan a los artículos, sino al sitio desmantelado. No obstante, los artículos se pueden encontrar con las imágenes.

Sería “agradable tener” si Discourse soportara una exportación estática. :smile:.

2 Me gusta

Lo bueno es que tienes todos los datos, así que se podría escribir uno que exportara los datos directamente de una copia de seguridad si alguien tuviera la inclinación de hacerlo.

Pero es poco probable que escribamos uno :wink:

1 me gusta

No debería ser muy difícil arreglar los enlaces internos, parece que solo necesitan que se les agregue .html