Какие характеристики у сервера? Похоже, что ему не хватает ресурсов? Скорее всего, это процессор. Возможно, в это время выполняется какая-то ежедневная задача?
Я проверю размер базы данных, не ожидаю, что он будет большим (резервные копии составляют около 57 МБ).
Время работы экземпляра составляет чуть менее десяти часов с момента восстановления, так как для этого потребовалось остановить и перезапустить виртуальный сервер — я не мог получить доступ к оболочке или консоли.
Этот тип экземпляра работает стабильно с момента его создания (по моим оценкам, в феврале 2021 года).
Звучит так, будто это происходит, когда AWS переносит вашу виртуальную машину с одного хоста на другой, и из-за этого она оказывается в странном состоянии. Обычно перезагрузка решает проблему.
Произошел второй подобный сбой при «высокой нагрузке».
Предполагаю, что это связано с конкуренцией за ресурсы.
Кто-нибудь пробовал использовать снимок Lightsail для создания снимка экземпляра и его восстановления на экземпляре большего размера в качестве метода обновления?
Я перенёс инстанс с помощью снимка Lightsail с конфигурации 1 vCPU, 1 ГБ ОЗУ и 40 ГБ SSD на конфигурацию 2 vCPU, 4 ГБ ОЗУ и 80 ГБ SSD.
Помимо необходимости отсоединить и снова присоединить публичный IP-адрес, что было довольно просто, меня беспокоит вопрос: «что я мог упустить»?
Есть ли что-то (резервные копии, почта, конфигурация бакета S3 и т. д.), что мне следует проверить, или мне нужно заново выполнить начальные параметры установки, чтобы воспользоваться преимуществами обновлённых ресурсов?
Исходя из этой ссылки, я думаю, можно увеличить db_shared_buffer хотя бы до 1 ГБ. В текущем файле app.yml указано 128 МБ, а также упоминается автоматическая настройка при загрузке.