"Случайные" ошибки 502

У меня установлена Discourse на сервере GCE. Пользователи сообщают о проблемах: система случайно возвращает ошибки 502. Я могу воспроизвести ситуацию, переходя по ссылкам «Последние», «Новые», «Непрочитанные», «Лучшие» и «Категории». В конце концов одна из них выдаст ошибку 502.

Я проверил логи моего прокси-сервера, и для сбойных URL он записывает такие сообщения:
«upstream prematurely closed connection while reading response header from upstream». Ошибок очень много, и они возникают для, казалось бы, случайных URL.

Вот шаги, которые я предпринял, чтобы решить проблему, основываясь на увиденных мной публикациях:

  • Обновил операционную систему
  • Обновил Docker
  • Обновил Discourse
  • Перезагрузил сервер

Первоначальная установка была выполнена по руководству Docker Cloud Setup. Затем я следовал руководству для переключения резервных копий и образов на использование S3.

Мой сервер работает под управлением:
Ubuntu 14.04.6 LTS (GNU/Linux 4.4.0-148-generic x86_64)

Согласно выводу discourse-doctor:

     DOCKER VERSION: Docker version 18.06.3-ce, build d7080c1

==================== MEMORY INFORMATION ====================
RAM (MB): 4820

             total       used       free     shared    buffers     cached
Mem:          4707       2206       2501        140        101        948
-/+ buffers/cache:       1156       3550
Swap:         2047          0       2047

==================== DISK SPACE CHECK ====================
---------- OS Disk Space ----------
Filesystem      Size  Used Avail Use% Mounted on
/dev/sda1        50G   33G   15G  70% /
/dev/sda1        50G   33G   15G  70% /var/lib/docker

==================== DISK INFORMATION ====================

Disk /dev/sda: 53.7 GB, 53687091200 bytes
255 heads, 63 sectors/track, 6527 cylinders, total 104857600 sectors
Units = sectors of 1 * 512 = 512 bytes
Sector size (logical/physical): 512 bytes / 4096 bytes
I/O size (minimum/optimal): 4096 bytes / 4096 bytes
Disk identifier: 0x00000000

   Device Boot      Start         End      Blocks   Id  System
/dev/sda1   *       16065   104856254    52420095   83  Linux
Partition 1 does not start on physical sector boundary.

==================== END DISK INFORMATION ====================

Я запускал top и следил за показателями процессора и памяти, но ничего тревожного не обнаружил. Я также просмотрел логи и не нашёл ничего, что указывало бы на проблему.

Есть ли какие-то дополнительные данные, которые я могу предоставить, чтобы помочь в устранении неполадок? Какие шаги мне следует предпринять для поиска причины?

Спасибо,

Стивен

It could be that Postgres needs a bit more memory. You’ve got plenty, so you might bump db_shared_buffers to 1024MB. You might also bump db_work_mem to 80MB.

Thank you for the suggestion. I made both of those changes in the yml file. Restarting the app didn’t seem to make a difference, so I ended up rebooting the server. Unfortunately I can still replicate the problem.

You need to rebuild or

cd /var/discourse
./launcher destroy app
./launcher start app

for the changes to take effect.

And, this might not be a silver bullet, but I have seen it help.

So far so good, we’ll monitor and see how this helps. Thank you!