3.4.0.beta4-dev ( 58f75ed205 ) アップグレード以来、CPU使用率が増加

LotusJeff · 2025 年 2 月 3 日午前 4:18

この週末のアップグレード以降、CPU使用率が大幅に増加しました。RUBYのCPU使用率が主な原因となっているようです。これは、他のDiscourseユーザーがこのトピックで言及していました。

下のグラフからわかるように、アップグレード前のCPU使用率とロードは、アップグレード後よりもはるかに低かったです。アップグレードは1月31日の夜に行われました。

以下は、33時間間隔で取得したTOPの2つの画像です。

33時間で、かなりのRuby CPU使用量があります。TOPデータに基づくと、過去33時間で22日間の2倍のCPU使用率を観測しました。33時間で、11時間のCPU時間（5つのPIDにわたる648分間のCPU時間）を観測しました。

追加データ：

トラフィックは過去2日間で約10％減少しました。（分析とダッシュボード）
標準的な単一コンテナのDiscourseインストール（チャットなし）
Sidekiqキューは最小限です（1日あたり1Kから2K）。
Discourseログに異常は見られません。
DOサーバーで8GB RAMと2つのAMD vCPUで実行しています。

サーバーがクリティカルにダウンしているわけではありませんが、5％から7％で実行されているサーバーは、25％で実行されているサーバーよりもはるかに良好です。

この問題のトラブルシューティングに役立つ情報はありますか？

よろしくお願いします。

sam · 2025 年 2 月 3 日午前 4:44

バグかどうか判明するまで、しばらくサポートに残しておきましょう。

コンテナに入り、内部から htop を実行してください（インストールが必要です）。そうすれば、どの特定のプロセスが高CPUを消費しているか特定できます。

このようなテクニックを使用すると、もう少し詳細な情報を得ることができます: Debugging 100% CPU usage in production Ruby on Rails systems

しかし、最も可能性が高いのは、インスタンスで Sidekiq /sidekiq が過負荷になっていることです。（特にスケジューラを確認することをお勧めします）

LotusJeff · 2025 年 2 月 3 日午前 5:09

htop のビュー。

こちらは30秒のビデオです:

ランダムなスクリーンショット:

ツリービュー:

sidekiq:

何か特定の情報が必要な場合はお知らせください。

sam · 2025 年 2 月 3 日午前 5:41

何かおかしいですね。

top -H -p PID_OF_UNICORN

V8 DefaultWorker が表示されると思います。mini_racer のリグレッションだと思います…これを元に戻して解決するかどうか確認します。

sam · 2025 年 2 月 3 日午前 6:18

これで元に戻されました。

コミットでパフォーマンスが回復するかどうか教えてください。

LotusJeff · 2025 年 2 月 3 日午前 7:18

はい、CPU使用率の高い問題は解決しました。1分および5分間の負荷は、以前の値の約1/3になりました。これは、htopとnetdataがシステムで実行されている状態での値です。

HTOP動画

グラフ

データベースクエリがシステムにキャッシュされるにつれて、CPU使用率と負荷は徐々に低下すると予想されます。

負荷表：

時間	修正前	修正後
1分	0.4～0.6	0.06～0.1
5分	0.39～0.5	0.15～0.18

15分間の指標は再構築の影響を受けています。今朝遅くにさらに統計情報を投稿します。

深夜の修正、ありがとうございました。

sam · 2025 年 2 月 3 日午前 7:27

申し訳ありませんが、mini_racer のアップグレードは大変な冒険でした。近いうちに乗り越えられることを願っています。

LotusJeff · 2025 年 2 月 3 日午後 4:05

迅速な調査対応ありがとうございます。

本日はロールバック以外の予定があったことと存じます。

Discourseの新規ユーザーとして、移行から2週間経ちましたが、この製品は非常に使いやすいです。

X_Y · 2025 年 2 月 3 日午後 6:53

こちらも同様のストーリーです。

[編集：最新ブランチに更新した後、現在は修正されたようです]

LotusJeff · 2025 年 2 月 4 日午前 12:46

再構築から18時間後のパフォーマンスレビューです。ロードテーブルがすべてを物語っています。

ロードテーブル：

時間	修正前	修正後
1分	0.4～0.6	0.03～0.05
5分	0.39～0.5	0.09
15分	0.68	0.12

凡例：

赤い矢印 - アプリを再構築
紫色の矢印 - netdataをオフにした

sam · 2025 年 2 月 4 日午前 5:47

追伸、この件は解決しました。原因となったバグは以下の通りです。

gemを更新しました。すぐにわかった利点は、このバージョンのv8はメモリ使用量がわずかに少ないようで、これは良いことです。

LotusJeff · 2025 年 2 月 7 日午後 2:37

修正を適用するために、昨晩最新のリリースをインストールしました。CPU使用率は過去の水準に戻りました。

素晴らしい仕事をしていただきありがとうございます。

トピック		返信	表示
CPU usage increases steadily Support	14	253	2025 年 3 月 8 日
Higher idle process activity after upgrade Self-hosting	7	722	2020 年 5 月 25 日
High CPU usage (Ruby) Support server-resources	20	778	2025 年 2 月 3 日
Server Performance Issues Due to High CPU Usage Support	5	353	2025 年 2 月 23 日
Strange CPU usage since latest upgrade Self-hosting server-resources	14	1066	2019 年 4 月 11 日