Неудачное восстановление привело к сбоям в заданиях Sidekiq

Я сделал резервную копию сервера перед массовым удалением, но из-за опечатки (сон на первом месте :blush:) пришлось запустить восстановление.

При первом запуске процесс прервался на полпути, и мне не пришло никакого лога. Я запустил восстановление во второй раз, и на этот раз оно завершилось успешно, а лог был отправлен.

Теперь я получаю ошибку обновления Sidekiq:
Проверка обновлений не была выполнена. Убедитесь, что Sidekiq запущен.

Попытался запустить её вручную через /sidekiq/scheduler, но она продолжает завершаться с ошибкой через 60 секунд.

В разделе “повторы” (retries) ошибка выглядит так:
Jobs::HandledExceptionWrapper: Wrapped Excon::Error::Timeout: connect_write timeout reached

Не понимаю, что происходит. Форум всё ещё работает, но несколько других задач Sidekiq завершаются с ошибкой.

Может, перезагрузить. Но, скорее всего, вы заняты запуском процессов после восстановления. Сколько оперативной памяти, места на диске, процессора и постов?

Вы можете игнорировать эту ошибку. Сбой в сети в одном из наших дата-центров в настоящее время влияет на проверку версий для пользователей с самостоятельным размещением. Они снова начнут работать после устранения инцидента.

Я перезагрузил сервер. На форуме более 100 тысяч сообщений (точное число найти не удалось), и каждые несколько минут накапливаются прямые ссылки на изображения.

Другие характеристики: 2 процессора, 80 ГБ памяти, 4 ГБ ОЗУ.

Я видел, что вы упомянули об этом в другом посте. Сообщали ли другие пользователи, размещающие форумы, об этой проблеме?

Нет, не они. Это незначительная проблема, и она заметна только если смотреть логи в нужный момент. :wink: На работу Discourse это никак не влияет. Беспокоиться не стоит.

Все задачи по горячей ссылке изображений успешно выполнены, и рабочий Jobs::VersionCheck теперь отображает статус OK. Похоже, что накопленная очередь мешала его корректной работе.

@pfaffman @gerhard Большое спасибо вам обоим!