It would be nice to have some sort of health check API. We recently faced an issue with an update and Discourse was producing 500 errors.
However, curl returned 200:
curl -I https://forum.gitlab.com
HTTP/2 200
server: nginx
It would be nice to have some sort of health check API. We recently faced an issue with an update and Discourse was producing 500 errors.
However, curl returned 200:
curl -I https://forum.gitlab.com
HTTP/2 200
server: nginx
This exists, see
/srv/status
Ah, thank you! I was searching “health check” and that didn’t yield any results.
Post is 404. What are the endpoints?
I’ve updated my post.
Actually I don’t think /srv/status would catch migration issues like the one mentioned above…
(and it would be pretty hard to build a check that does catch issues like that one)
Yes… /srv/status is there as a very cheap test, all it does is ensures the apps middleware stack is working.
To catch issues where you auto deploy I would recommend monitoring 200s, if there is a large increase in non 200s alert.
Wäre https://discourse.example.org/srv/status ein guter Ort, um einen Uptime-Monitor hinzuzufügen? Ich denke, es reicht vielleicht nicht aus, nur zuverlässig zu messen, ob die Seite online ist, aber es wäre schön, etwas zu haben, das weniger Last auf dem System für Überwachungszwecke verursacht.
(Alternativ: Gibt es vielleicht Pläne, die auf diesem Endpunkt aufgeführten Komponenten zu erweitern?)
Ja, das ist ein vernünftiger Ort. Du kannst auch auf ein bestimmtes Thema zeigen und nach Text suchen, wenn du etwas ausgefalleneres möchtest.
Ja, wir haben bisher /about verwendet, neigen aber dazu, stattdessen dies zu nutzen.
Mein alter Ops-/On-Call-Verstand hat mich daran erinnert, dass es immer noch interessant sein könnte (und gelegentlich hilfreich bei der Fehlersuche), wenn es so etwas wie folgendes wäre:
db ok
middleware ok
whatever-else ok
...
all systems ok