¿Alguna actualización sobre la mejor manera de crear un archivo HTML de un sitio estático?

justin_gordon · 10 Julio, 2025 23:10

¡Actualización!

Esta podría ser la respuesta:

Miré:
Improving Discourse static HTML archive.

Es antiguo.

Voy a retirar https://forum.talksurf.com/.

Sí, voy a archivar una copia de seguridad.

¿Pero qué pasa si solo quiero algunos archivos HTML para navegar?

¿Debería simplemente ejecutar ArchiveDiscourse/archive-discourse.py at master · kitsandkats/ArchiveDiscourse · GitHub?

¿O hay algo mejor?

¡Gracias de antemano!

CC: @pfaffman
Aloha,
Justin

NateDhaliwal · 10 Julio, 2025 23:19

¿Algo como Wayback Machine sería similar?

justin_gordon · 11 Julio, 2025 00:00

Esto funcionó. Tuve que hacer una pequeña actualización de código.

pfaffman · 11 Julio, 2025 22:36

¡Pero no mucho más viejo que tu versión de Discourse!

He tenido algo de suerte reflejando sitios con wget. Algo como

wget --mirror --page-requisites --convert-links --adjust-extension --compression=auto --reject-regex "/search" --no-if-modified-since --no-check-certificate --execute robots=off --random-wait --wait=1 --user-agent="Googlebot/2.1 (+http://www.google.com/bot.html)" --no-cookies --header "Cookie: _t=$COOKIE" https://forum.talksurf.com/

Pero necesitas obtener la cookie llamada _t

Envíame un correo electrónico y veré qué puedo hacer.

翔_贺 · 14 Julio, 2025 01:50

He estado haciendo esto recientemente, y así es como lo hice。

 def serve
    file_path = File.expand_path(
      params[:path]+"."+params[:format],
      File.join(File.dirname(__FILE__), "../../public")
    )
    if File.file?(file_path)
      send_file file_path, type: "text/html", disposition: "inline"
    else
      render plain: "404 Not Found", status: 404
    end
  end

justin_gordon · 15 Julio, 2025 00:11

Solo para informarte, esto no extrae las imágenes con nuevas URL. Las fotos seguirán apuntando a tu servidor (¡que está a punto de ser desmantelado!).

justin_gordon · 15 Julio, 2025 00:18

Jay amablemente me envió el volcado y lo comparé con el mío.

Su técnica funciona mejor en el sentido de que guarda las imágenes.

Sin embargo, sus enlaces internos no apuntan a los artículos, sino al sitio desmantelado. No obstante, los artículos se pueden encontrar con las imágenes.

Sería “agradable tener” si Discourse soportara una exportación estática. .

supermathie · 15 Julio, 2025 00:26

Lo bueno es que tienes todos los datos, así que se podría escribir uno que exportara los datos directamente de una copia de seguridad si alguien tuviera la inclinación de hacerlo.

Pero es poco probable que escribamos uno

pfaffman · 15 Julio, 2025 00:52

No debería ser muy difícil arreglar los enlaces internos, parece que solo necesitan que se les agregue .html

manuel · 16 Abril, 2026 18:32

Aún me encantaría ver un buen generador de archivos para Discourse.

Déjale a Claude una oportunidad, lo comparto aquí como referencia y para mantener esta característica en el radar:

Por ahora es una configuración básica: temas, categorías, etiquetas y usuarios. La búsqueda también funciona. He subido un archivo de una instancia de demostración local a una página de GitHub:

pfaffman · 16 Abril, 2026 19:05

Eso probablemente sea mejor que esto.

Pega lo siguiente para asignar la cookie a COOKIE y luego pega las cookies copiadas al portapapeles por la extensión Cooke de Chrome.


COOKIE=$(cat |jq -r '.[ ]|select(.name == "\_t")|.value')

introduce la URL aquí:

luego pega:


wget --mirror --page-requisites --convert-links --adjust-extension --compression=auto --reject-regex "/search" --no-if-modified-since --no-check-certificate --execute robots=off --random-wait --wait=1 --user-agent="Googlebot/2.1 (+http://www.google.com/bot.html)" --no-cookies --header "Cookie: \_t=$COOKIE" =FORUMURL=

Tema		Respuestas	Vistas
Improving Discourse static HTML archive Feature	5	2115	7 Abril 2019
How do I export the complete forum as static html pages? Support	3	2999	11 Mayo 2022
Archiving an inactive discourse forum Support	4	1225	31 Mayo 2016
Archive an old forum "in place" to start a new Discourse forum Migrating to Discourse	0	19630	5 Marzo 2014
A basic Discourse archival tool Development	24	14642	30 Abril 2025

¿Alguna actualización sobre la mejor manera de crear un archivo HTML de un sitio estático?

Temas relacionados