LotusJeff
(Jeff Cocking)
1
この週末のアップグレード以降、CPU使用率が大幅に増加しました。RUBYのCPU使用率が主な原因となっているようです。これは、他のDiscourseユーザーがこのトピックで言及していました。
下のグラフからわかるように、アップグレード前のCPU使用率とロードは、アップグレード後よりもはるかに低かったです。アップグレードは1月31日の夜に行われました。
以下は、33時間間隔で取得したTOPの2つの画像です。
33時間で、かなりのRuby CPU使用量があります。TOPデータに基づくと、過去33時間で22日間の2倍のCPU使用率を観測しました。33時間で、11時間のCPU時間(5つのPIDにわたる648分間のCPU時間)を観測しました。
追加データ:
- トラフィックは過去2日間で約10%減少しました。(分析とダッシュボード)
- 標準的な単一コンテナのDiscourseインストール(チャットなし)
- Sidekiqキューは最小限です(1日あたり1Kから2K)。
- Discourseログに異常は見られません。
- DOサーバーで8GB RAMと2つのAMD vCPUで実行しています。
サーバーがクリティカルにダウンしているわけではありませんが、5%から7%で実行されているサーバーは、25%で実行されているサーバーよりもはるかに良好です。
この問題のトラブルシューティングに役立つ情報はありますか?
よろしくお願いします。
「いいね!」 3
sam
(Sam Saffron)
2
バグかどうか判明するまで、しばらくサポートに残しておきましょう。
コンテナに入り、内部から htop を実行してください(インストールが必要です)。そうすれば、どの特定のプロセスが高CPUを消費しているか特定できます。
このようなテクニックを使用すると、もう少し詳細な情報を得ることができます: Debugging 100% CPU usage in production Ruby on Rails systems
しかし、最も可能性が高いのは、インスタンスで Sidekiq /sidekiq が過負荷になっていることです。(特にスケジューラを確認することをお勧めします)
sam
(Sam Saffron)
4
何かおかしいですね。
top -H -p PID_OF_UNICORN
V8 DefaultWorker が表示されると思います。mini_racer のリグレッションだと思います…これを元に戻して解決するかどうか確認します。
「いいね!」 1
sam
(Sam Saffron)
5
これで元に戻されました。
コミットでパフォーマンスが回復するかどうか教えてください。
「いいね!」 6
LotusJeff
(Jeff Cocking)
6
はい、CPU使用率の高い問題は解決しました。1分および5分間の負荷は、以前の値の約1/3になりました。これは、htopとnetdataがシステムで実行されている状態での値です。
HTOP動画
グラフ
データベースクエリがシステムにキャッシュされるにつれて、CPU使用率と負荷は徐々に低下すると予想されます。
負荷表:
| 時間 |
修正前 |
修正後 |
| 1分 |
0.4~0.6 |
0.06~0.1 |
| 5分 |
0.39~0.5 |
0.15~0.18 |
15分間の指標は再構築の影響を受けています。今朝遅くにさらに統計情報を投稿します。
深夜の修正、ありがとうございました。
「いいね!」 3
sam
(Sam Saffron)
7
申し訳ありませんが、mini_racer のアップグレードは大変な冒険でした。近いうちに乗り越えられることを願っています。
「いいね!」 3
LotusJeff
(Jeff Cocking)
8
迅速な調査対応ありがとうございます。
本日はロールバック以外の予定があったことと存じます。
Discourseの新規ユーザーとして、移行から2週間経ちましたが、この製品は非常に使いやすいです。
「いいね!」 2
LotusJeff
(Jeff Cocking)
10
再構築から18時間後のパフォーマンスレビューです。ロードテーブルがすべてを物語っています。
ロードテーブル:
| 時間 |
修正前 |
修正後 |
| 1分 |
0.4~0.6 |
0.03~0.05 |
| 5分 |
0.39~0.5 |
0.09 |
| 15分 |
0.68 |
0.12 |
凡例:
- 赤い矢印 - アプリを再構築
- 紫色の矢印 - netdataをオフにした
sam
(Sam Saffron)
11
追伸、この件は解決しました。原因となったバグは以下の通りです。
gemを更新しました。すぐにわかった利点は、このバージョンのv8はメモリ使用量がわずかに少ないようで、これは良いことです。
「いいね!」 6
LotusJeff
(Jeff Cocking)
12
修正を適用するために、昨晩最新のリリースをインストールしました。CPU使用率は過去の水準に戻りました。
素晴らしい仕事をしていただきありがとうございます。
「いいね!」 1
system
(system)
クローズされました:
13
This topic was automatically closed 30 days after the last reply. New replies are no longer allowed.