ヘルスチェック API

axil · 2019 年 6 月 4 日午前 8:40

It would be nice to have some sort of health check API. We recently faced an issue with an update and Discourse was producing 500 errors.

However, curl returned 200:

curl -I https://forum.gitlab.com
HTTP/2 200
server: nginx

codinghorror · 2019 年 6 月 4 日午前 8:58

This exists, see

/srv/status

axil · 2019 年 6 月 4 日午前 11:53

Ah, thank you! I was searching “health check” and that didn’t yield any results.

ryancey · 2019 年 7 月 29 日午前 8:44

投稿が見つかりません（404）。エンドポイントは何ですか？

codinghorror · 2019 年 7 月 29 日午前 8:56

投稿を更新しました。

michaeld · 2019 年 7 月 29 日午前 11:21

実は、上記のような移行の問題は /srv/status では検出できないと思います…

（そのような問題を検出するチェックを構築するのはかなり難しいでしょう）

sam · 2019 年 7 月 30 日午前 8:22

はい… /srv/status は非常に安価なテストとして用意されており、アプリのミドルウェアスタックが正常に動作していることを確認するだけのものです。

自動デプロイ時の問題を検知するには、200 番ステータスの監視をお勧めします。200 番以外のステータスが大幅に増加した場合はアラートを出すようにしてください。

downey · 2020 年 1 月 28 日午後 9:18

（あるいは、このエンドポイントに記載されているコンポーネントを拡張する予定はありますか？）

sam · 2020 年 1 月 28 日午後 9:19

そうですね、それは妥当な場所です。より高度なことをしたい場合は、特定のトピックを指してテキストを検索することもできます。

downey · 2020 年 1 月 28 日午後 9:27

はい、以前は /about を使っていましたが、こちらを使う方向で検討しています。

昔のオペレーションやオンコール対応の経験から、以下のような形式にすると、場合によってはトラブルシューティングに役立ったり、興味深いものになったりするかもしれないと考えました。

db ok
middleware ok
whatever-else ok
...
all systems ok

トピック		返信	表示
How to test /srv/status Support	1	739	2021 年 3 月 17 日
`/srv/status` returns OK even if database is broken Development	6	687	2020 年 7 月 18 日
What URL should we monitor to be sure Discourse is up Support	2	1582	2016 年 4 月 25 日
Webhook for Discourse Uptime Monitoring? Development	24	1911	2026 年 1 月 16 日
`/srv/status` monitoring endpoint doesn't catch some service unavailability issues - one example free space Feature	14	1618	2017 年 4 月 26 日