90%以上でウェイト状態によるロックアップ

tisawyer · 2020 年 6 月 24 日午後 5:18

Discourse がロックアップし、CPU の待機状態（top の wa:）が 90% 以上になっています。この状態を引き起こす一般的な原因として、他の管理者が経験したことはありますか？私は AWS 上で Debian を実行しています。

Falco · 2020 年 6 月 24 日午後 5:36

データベースはRDSにありますか、それともWebと同じコンテナ内ですか？

マシンディスクはEBSネットワークマウントですか？許可されたIOPSを使い果たしていないか確認しましたか？

tisawyer · 2020 年 6 月 25 日午後 10:58

データベースは同じ Docker コンテナ内にあります。この環境を構築してくれた人が、8GiB と 32GiB の 2 つの EBS ボリュームを作成しました。ボリュームタイプは GP2 で、両方とも 100 IOPS です。この IOPS 数で十分でしょうか？https://aws.amazon.com/premiumsupport/knowledge-center/optimize-ebs-provisioned-iops/ という記事を読んで学んでいますが、方向性を示すヒントがあれば大変助かります。

編集：上記の記事で言及されている「キューの長さ」が、先月 19 日の障害時に非常に長くなっていたことが分かりました（以下のチャート参照）。問題は、何がその原因となっているのかを特定し、どうすればそれを防ぐことができるかという点です。

トピック		返信	表示
Connection timed out while connecting to upstream on AWS Self-hosting hosting	12	3900	2016 年 6 月 28 日
Another discourse mystery Self-hosting	12	827	2022 年 10 月 16 日
Trying to troubleshoot I/O Wait bottleneck Self-hosting hosting	1	1082	2020 年 10 月 30 日
I just hit my CPU cap on the Digital Ocean 2GB/2xCPU plan Self-hosting hosting	35	17775	2018 年 4 月 30 日
Discourse unavailable with high load average Support	19	2535	2018 年 9 月 5 日

90%以上でウェイト状態によるロックアップ

関連トピック