Мы только что обновились с версии 3.0.6 до 3.1.2, и я наблюдаю множество ошибок 503, в основном в трёх точках:
- Многие аватары не загружаются.
- Загрузка изображений работает лишь иногда.
- Также наблюдается множество ошибок для
topics/timings.
Я изучил логи сервера: большинство ошибок 503 даже не отображаются в production.log, зато их полно в логах nginx. Подумав, что это может быть связано с ограничением частоты запросов в nginx, я попробовал не использовать файл templates/web.ratelimited.template.yml, но это, похоже, не помогло. Я всё ещё вижу большое количество запросов, завершающихся с кодом 503, в основном это user_avatars/show. Насколько я понял, production.log их вообще не фиксирует.
В Sidekiq ничего подозрительного не заметил. Однако в /logs были ошибки вида:
'hijack user_avatars show ' is still running after 90 seconds on db default, this process may need to be restarted!
Но это произошло несколько часов назад. С тех пор я несколько раз пересоздавал инстанс, и эти ошибки больше не появлялись.
Этот инстанс использует SSO, поэтому аватары (URL) берутся оттуда. Для изображений мы используем S3.
Я немного озадачен тем, что вызывает эти проблемы, и у меня закончились идеи.
Есть ли какие-либо подсказки, куда или на что стоит обратить внимание?
