It would be nice to have some sort of health check API. We recently faced an issue with an update and Discourse was producing 500 errors.
However, curl returned 200:
curl -I https://forum.gitlab.com
HTTP/2 200
server: nginx
It would be nice to have some sort of health check API. We recently faced an issue with an update and Discourse was producing 500 errors.
However, curl returned 200:
curl -I https://forum.gitlab.com
HTTP/2 200
server: nginx
This exists, see
/srv/status
Ah, thank you! I was searching “health check” and that didn’t yield any results.
Запись не найдена (404). Какие существуют конечные точки?
Я обновил свой пост.
На самом деле, я не думаю, что /srv/status сможет отловить проблемы миграции, подобные упомянутой выше…
(и было бы довольно сложно создать проверку, которая бы отлавливала подобные проблемы)
Да… /srv/status присутствует как очень дешёвый тест: он лишь проверяет, что стек промежуточного ПО приложений работает корректно.
Для обнаружения проблем при автоматическом развёртывании рекомендую отслеживать ответы со статусом 200; если количество ответов, отличных от 200, резко возрастёт, следует отправить оповещение.
Будет ли https://discourse.example.org/srv/status хорошим местом для подключения мониторинга доступности? Мне кажется, что для надёжной проверки «работает ли сайт» этого может быть недостаточно, но было бы приятно иметь что-то, что создаёт меньшую нагрузку на систему в целях мониторинга.
(Альтернативно, есть ли какие-либо планы по расширению компонентов, перечисленных в этом эндпоинте?)
Да, это разумное место. Вы также можете указать на конкретную тему и выполнить поиск по тексту, если хотите что-то более продвинутое.
Да, мы использовали /about, но склоняемся к использованию этого варианта.
Мой старый опыт работы в операционной поддержке и дежурстве подсказал, что это может быть интересно (и иногда полезно для устранения неполадок), если это будет выглядеть примерно так:
db ok
middleware ok
что-то-ещё ok
...
все системы ok