API für Gesundheitsüberprüfung

It would be nice to have some sort of health check API. We recently faced an issue with an update and Discourse was producing 500 errors.

However, curl returned 200:

curl -I https://forum.gitlab.com
HTTP/2 200
server: nginx
2 „Gefällt mir“

This exists, see

/srv/status

15 „Gefällt mir“

Ah, thank you! I was searching “health check” and that didn’t yield any results.

2 „Gefällt mir“

Post is 404. What are the endpoints?

I’ve updated my post.

2 „Gefällt mir“

Actually I don’t think /srv/status would catch migration issues like the one mentioned above…

(and it would be pretty hard to build a check that does catch issues like that one)

2 „Gefällt mir“

Yes… /srv/status is there as a very cheap test, all it does is ensures the apps middleware stack is working.

To catch issues where you auto deploy I would recommend monitoring 200s, if there is a large increase in non 200s alert.

5 „Gefällt mir“

Wäre https://discourse.example.org/srv/status ein guter Ort, um einen Uptime-Monitor hinzuzufügen? Ich denke, es reicht vielleicht nicht aus, nur zuverlässig zu messen, ob die Seite online ist, aber es wäre schön, etwas zu haben, das weniger Last auf dem System für Überwachungszwecke verursacht.

(Alternativ: Gibt es vielleicht Pläne, die auf diesem Endpunkt aufgeführten Komponenten zu erweitern?)

3 „Gefällt mir“

Ja, das ist ein vernünftiger Ort. Du kannst auch auf ein bestimmtes Thema zeigen und nach Text suchen, wenn du etwas ausgefalleneres möchtest.

7 „Gefällt mir“

Ja, wir haben bisher /about verwendet, neigen aber dazu, stattdessen dies zu nutzen.

Mein alter Ops-/On-Call-Verstand hat mich daran erinnert, dass es immer noch interessant sein könnte (und gelegentlich hilfreich bei der Fehlersuche), wenn es so etwas wie folgendes wäre:

db ok
middleware ok
whatever-else ok
...
all systems ok
4 „Gefällt mir“