Alguma atualização sobre a melhor forma de criar um arquivo HTML de um site estático?

justin_gordon · Julho 10, 2025, 11:10pm

Atualização!

Esta pode ser a resposta:

Eu olhei:

Improving Discourse static HTML archive.

É antigo.

Vou desativar https://forum.talksurf.com/.

Sim, vou arquivar um backup.

Mas e se eu quiser apenas alguns arquivos HTML navegáveis?

Devo apenas executar ArchiveDiscourse/archive-discourse.py at master · kitsandkats/ArchiveDiscourse · GitHub?

Ou existe algo melhor?

Obrigado antecipadamente!

CC: @pfaffman
Aloha,
Justin

NateDhaliwal · Julho 10, 2025, 11:19pm

Algo como o Wayback Machine seria semelhante?

justin_gordon · Julho 11, 2025, 12:00am

Isso funcionou. Tive que fazer uma pequena atualização de código.

pfaffman · Julho 11, 2025, 10:36pm

Mas não muito mais antigo que a sua versão do Discourse!

Tive alguma sorte espelhando sites com wget. Algo como

wget --mirror --page-requisites --convert-links --adjust-extension --compression=auto --reject-regex "/search" --no-if-modified-since --no-check-certificate --execute robots=off --random-wait --wait=1 --user-agent="Googlebot/2.1 (+http://www.google.com/bot.html)" --no-cookies --header "Cookie: _t=$COOKIE" https://forum.talksurf.com/

Mas você precisa obter o cookie chamado _t

Envie-me um e-mail e verei o que posso fazer.

翔_贺 · Julho 14, 2025, 1:50am

Tenho feito isso recentemente, e foi assim que eu fiz.

 def serve
    file_path = File.expand_path(
      params[:path]+"."+params[:format],
      File.join(File.dirname(__FILE__), "../../public")
    )
    if File.file?(file_path)
      send_file file_path, type: "text/html", disposition: "inline"
    else
      render plain: "404 Not Found", status: 404
    end
  end

justin_gordon · Julho 15, 2025, 12:11am

Apenas para informar, isso não puxa as imagens com novas URLs. As fotos ainda apontarão para o seu servidor (que está prestes a ser desativado!).

justin_gordon · Julho 15, 2025, 12:18am

Jay gentilmente me enviou o dump e eu o comparei com o meu.

A técnica dele funciona melhor no sentido de que salva as imagens.

No entanto, os links internos dele não apontam para os artigos, mas sim para o site desativado. Contudo, os artigos podem ser encontrados com as imagens.

Seria um “nice to have” se o Discourse suportasse uma exportação estática. .

supermathie · Julho 15, 2025, 12:26am

A coisa boa é que você tem todos os dados, então um poderia ser escrito que exportasse os dados diretamente de um backup se alguém tivesse inclinação para fazê-lo.

Mas nós não vamos escrever um

pfaffman · Julho 15, 2025, 12:52am

Não deve ser muito difícil corrigir os links internos, parece que eles só precisam que .html seja adicionado

Tópico		Respostas	Visualizações
Improving Discourse static HTML archive Feature	5	2044	7 de Abril de 2019
How do I export the complete forum as static html pages? Support	4	2909	11 de Maio de 2022
Archive an old forum "in place" to start a new Discourse forum Migrating to Discourse	0	19475	5 de Março de 2014
Archiving an inactive discourse forum Support	6	1186	28 de Janeiro de 2022
A basic Discourse archival tool Dev	24	14261	30 de Abril de 2025

Alguma atualização sobre a melhor forma de criar um arquivo HTML de um site estático?

Tópicos relacionados