Есть ли обновления по лучшему способу создания HTML-архива статического сайта?

justin_gordon · 10.Июль.2025 23:10:36

Обновление!

Это может быть ответ:

Я посмотрел:

Improving Discourse static HTML archive.

Это устарело.

Я собираюсь закрыть https://forum.talksurf.com/.

Да, я сделаю архивную копию.

Но что, если мне просто нужны просматриваемые HTML-файлы?

Мне стоит просто запустить ArchiveDiscourse/archive-discourse.py at master · kitsandkats/ArchiveDiscourse · GitHub?

Или есть что-то получше?

Заранее спасибо!

CC: @pfaffman

Алоха,

Джастин

NateDhaliwal · 10.Июль.2025 23:19:19

Не что-то вроде «Машины времени» было бы похоже?

justin_gordon · 11.Июль.2025 00:00:09

Это сработало. Мне пришлось внести незначительное обновление кода.

pfaffman · 11.Июль.2025 22:36:42

Но не намного старше вашей версии Discourse!

Мне удавалось успешно зеркалить сайты с помощью wget. Что-то вроде:

wget --mirror --page-requisites --convert-links --adjust-extension --compression=auto --reject-regex "/search" --no-if-modified-since --no-check-certificate --execute robots=off --random-wait --wait=1 --user-agent="Googlebot/2.1 (+http://www.google.com/bot.html)" --no-cookies --header "Cookie: _t=$COOKIE" https://forum.talksurf.com/

Но вам нужно получить cookie с именем _t.

Напишите мне на почту, и я посмотрю, что смогу сделать.

翔_贺 · 14.Июль.2025 01:50:50

Я делал это недавно, и вот как я это сделал.

 def serve
    file_path = File.expand_path(
      params[:path]+"."+params[:format],
      File.join(File.dirname(__FILE__), "../../public")
    )
    if File.file?(file_path)
      send_file file_path, type: "text/html", disposition: "inline"
    else
      render plain: "404 Not Found", status: 404
    end
  end

justin_gordon · 15.Июль.2025 00:11:38

Сообщаем, что изображения с новыми ссылками не подтягиваются. Фотографии по-прежнему будут указывать на ваш сервер (который вот-вот будет выведен из эксплуатации!).

justin_gordon · 15.Июль.2025 00:18:12

Джей любезно прислал мне дамп, и я сравнил его со своим.

Его техника работает лучше в том смысле, что она сохраняет изображения.

Однако его внутренние ссылки ведут не на статьи, а на закрытый сайт. Тем не менее, статьи можно найти вместе с изображениями.

Было бы «приятным дополнением», если бы Discourse поддерживал статический экспорт.

supermathie · 15.Июль.2025 00:26:41

Хорошая новость в том, что у вас есть все данные, поэтому кто-то мог бы написать утилиту для экспорта данных напрямую из резервной копии, если у кого-то появится такое желание.

Но вряд ли мы напишем такую утилиту

pfaffman · 15.Июль.2025 00:52:43

Исправить внутренние ссылки не должно быть слишком сложно, похоже, им нужно просто добавить .html.

Я думал, что --convert-links исправит эти ссылки…

manuel · 16.Апрель.2026 18:32:35

Мне всё ещё хотелось бы увидеть хороший генератор архивов для Discourse.

Давайте просто дадим Claude возможность попробовать, делясь этим здесь для справки и держа эту функцию в курсе:

На данный момент это базовая настройка: темы, категории, теги и пользователи. Поиск тоже работает. Загрузил архив локального демонстрационного экземпляра на страницу GitHub:

pfaffman · 16.Апрель.2026 19:05:53

Скорее всего, это лучше, чем это.

Вставьте это, чтобы присвоить cookie переменной COOKIE, а затем вставьте файлы cookie, скопированные в буфер обмена расширением Cooke для Chrome.


COOKIE=$(cat |jq -r '.[ ]|select(.name == "\_t")|.value')

Введите URL здесь:

затем вставьте:


wget --mirror --page-requisites --convert-links --adjust-extension --compression=auto --reject-regex "/search" --no-if-modified-since --no-check-certificate --execute robots=off --random-wait --wait=1 --user-agent="Googlebot/2.1 (+http://www.google.com/bot.html)" --no-cookies --header "Cookie: \_t=$COOKIE" =FORUMURL=

Тема		Ответов	Просм.
Improving Discourse static HTML archive Feature	5	2112	07.04.2019
How do I export the complete forum as static html pages? Support	3	2996	11.05.2022
Archiving an inactive discourse forum Support	4	1225	31.05.2016
Archive an old forum "in place" to start a new Discourse forum Migrating to Discourse	0	19615	05.03.2014
A basic Discourse archival tool Development	24	14582	30.04.2025

Есть ли обновления по лучшему способу создания HTML-архива статического сайта?

Связанные темы