It would be nice to have some sort of health check API. We recently faced an issue with an update and Discourse was producing 500 errors.
However, curl returned 200:
curl -I https://forum.gitlab.com
HTTP/2 200
server: nginx
It would be nice to have some sort of health check API. We recently faced an issue with an update and Discourse was producing 500 errors.
However, curl returned 200:
curl -I https://forum.gitlab.com
HTTP/2 200
server: nginx
This exists, see
/srv/status
Ah, thank you! I was searching “health check” and that didn’t yield any results.
Post non trovato (404). Quali sono gli endpoint?
Ho aggiornato il mio post.
In realtà, non credo che /srv/status possa rilevare problemi di migrazione come quello menzionato sopra…
(e sarebbe piuttosto difficile creare un controllo che riesca a rilevare problemi di questo tipo)
Sì… /srv/status è presente come test molto economico: serve solo a verificare che lo stack middleware dell’applicazione funzioni correttamente.
Per rilevare problemi durante il deployment automatico, ti consiglio di monitorare le risposte 200; se si registra un forte aumento di risposte diverse da 200, attiva un avviso.
https://discourse.example.org/srv/status sarebbe un buon punto di riferimento per un monitor di uptime? Penso che potrebbe non essere sufficiente per avere una misura affidabile di “se il sito è attivo”, ma sarebbe utile avere qualcosa che generi meno carico sul sistema a scopo di monitoraggio.
(In alternativa, ci potrebbero essere piani per espandere i componenti elencati in questo endpoint?)
Sì, è un punto ragionevole. Se vuoi qualcosa di più avanzato, puoi anche puntare su un argomento specifico e cercare del testo.
Sì, avevamo usato /about, ma eravamo propensi a usare questo invece.
La mia vecchia mentalità di ops/on-call si è risvegliata, facendomi pensare che potrebbe essere comunque interessante (e talvolta utile per la risoluzione dei problemi) se fosse qualcosa del genere:
db ok
middleware ok
qualcos'altro ok
...
tutti i sistemi ok