It would be nice to have some sort of health check API. We recently faced an issue with an update and Discourse was producing 500 errors.
However, curl returned 200:
curl -I https://forum.gitlab.com
HTTP/2 200
server: nginx
It would be nice to have some sort of health check API. We recently faced an issue with an update and Discourse was producing 500 errors.
However, curl returned 200:
curl -I https://forum.gitlab.com
HTTP/2 200
server: nginx
This exists, see
/srv/status
Ah, thank you! I was searching “health check” and that didn’t yield any results.
El post no se encuentra (404). ¿Cuáles son los endpoints?
He actualizado mi publicación.
En realidad, no creo que /srv/status detecte problemas de migración como el mencionado anteriormente…
(y sería bastante difícil crear una verificación que detecte problemas como ese).
Sí… /srv/status está allí como una prueba muy económica; todo lo que hace es asegurarse de que la pila de middleware de la aplicación funcione correctamente.
Para detectar problemas en los que realizas una implementación automática, te recomiendo monitorear los códigos 200; si hay un aumento significativo en los que no son 200, configura una alerta.
¿Sería https://discourse.example.org/srv/status un buen lugar para dirigir un monitor de disponibilidad? Estoy pensando que quizás no sea suficiente para tener una medida fiable de «si el sitio está en línea», pero sería agradable tener algo que genere menos carga en el sistema con fines de monitoreo.
(Alternativamente, ¿podría haber planes para ampliar los componentes listados en este punto de acceso?)
Sí, ese es un punto razonable; también podrías apuntar a un tema específico y buscar texto si quieres algo más avanzado.
Sí, habíamos estado usando /about, pero nos inclinamos por usar esto en su lugar.
Mi antigua mentalidad de operaciones/on-call despertó y me hizo pensar que podría seguir siendo interesante (y útil ocasionalmente para solucionar problemas) si fuera algo como:
db ok
middleware ok
lo-que-sea ok
...
todos los sistemas ok