Как выполнить крупное обслуживание дискурса с минимальным временем простоя?

emonunix · 05.Сентябрь.2025 20:27:35

Я хотел бы обсудить лучшие практики выполнения основных задач обслуживания экземпляра Discourse с минимизацией или полным исключением простоев.

Такие задачи, как изменение настроек критических ресурсов (например, UNICORN_WORKERS, DISCOURSE_SIDEKIQ_WORKERS, DISCOURSE_DB_POOL) или применение крупных обновлений, обычно требуют выполнения команды launcher rebuild app, что может занять значительное время — иногда 30 минут и более.

Мой вопрос:
Какие рекомендуемые стратегии существуют для системных администраторов, чтобы выполнять эти важные обновления и изменения конфигурации с минимальным временем простоя для пользователей?

Существуют ли какие-либо передовые техники, такие как сине-зелёное развёртывание или другие стратегии развёртывания без простоя, которые поддерживаются или рекомендуются для Discourse? Или стандартный процесс rebuild является единственным поддерживаемым методом, и основное внимание следует уделить оптимизации самого времени развёртывания?

Мне интересно услышать от тех, у кого есть опыт управления крупными или высоконагруженными экземплярами, и узнать, как выглядит их рабочий процесс при проведении технического обслуживания.

Спасибо за любые советы!

pfaffman · 05.Сентябрь.2025 20:39:37

Если у вас установка с двумя контейнерами, новый контейнер собирается, пока работает старый. Простой составляет лишь время запуска нового контейнера. Единственная проблема в том, что вам нужно достаточно оперативной памяти для сборки контейнера, пока работает другой.

Переход от автономного контейнера к отдельным веб-контейнерам и контейнерам с данными, но я обычно переношу на новую виртуальную машину.

Если вам нужен нулевой простой, вам понадобится балансировщик нагрузки, который будет держать старый контейнер запущенным до тех пор, пока новый полностью не запустится. Затем вы отключаете старый контейнер и выполняете миграции после обновления.

Ethsim2 · 05.Сентябрь.2025 21:05:27

Можно ли иметь два контейнера данных при переключении на резервный?

Вы обычно используете отдельную виртуальную машину для данных?

merefield · 05.Сентябрь.2025 21:53:29

Discourse настолько стабилен, что для большинства установок это совершенно излишне (но, полагаю, вы можете рассмотреть это для требований сверхвысокой доступности или если вы хостите других?!)

За 7 лет у меня не было ни одного сбоя из-за производственного «сбоя»…

Самые рискованные моменты в жизни Discourse всегда связаны с пересборкой.

Конфигурация с двумя контейнерами дает возможность запустить новую сборку перед её утверждением, хотя, конечно, это не позволит выявить некоторые ошибки времени выполнения.

Проблема в том, что если миграции уже выполнены, вам, возможно, придется утвердить новую сборку, и поэтому вы обычно будете пытаться найти и устранить источник этих ошибок, а не откатываться.

В целом люди не пытаются откатываться…

pfaffman · 05.Сентябрь.2025 22:47:16

При масштабной переконфигурации я переезжаю на новую виртуальную машину.

Запустить зеркало PostgreSQL можно, но это требует много усилий.

itsbhanusharma · 05.Сентябрь.2025 23:42:38

Разве реплика для чтения не была бы лучше?

pfaffman · 06.Сентябрь.2025 00:41:16

Да! Реплика! Именно так они это называют. А если основной выйдет из строя, можно мгновенно переключиться на реплику.

Тема		Ответов	Просм.
Help with "zero downtime" setup Self-hosting hosting	7	2332	10.09.2020
How to install a plugin without rebuilding (or set a maintainance message) Support	10	3538	22.07.2020
How do I upgrade Discourse in a multiple container configuration? Self-hosting	2	941	08.10.2020
How to speed up container instantiation - if possible at all? Self-hosting	4	325	29.08.2023
Is there any faster way to re-build the site? Self-hosting	4	454	30.03.2024

Как выполнить крупное обслуживание дискурса с минимальным временем простоя?

Связанные темы