NASストレージにおける大量のネットワークトラフィック

hnaseri · 2022 年 10 月 5 日午後 3:55

アップロードファイルはすべてNASストレージ（glusterfs）でホストしています。

最近、NASで大量の定常的なネットワークトラフィックが発生していることに気づき、原因を調査したところ、Discourseが最適化された画像を要求していることがわかりました。これらの画像を常に検索するジョブはありますか？それはなぜですか？そして、どうすれば無効にできますか？

hnaseri · 2022 年 10 月 5 日午後 11:34

btw アップロードサイトの設定のクリーンアップは、私のフォーラムでは無効になっています。

sam · 2022 年 10 月 6 日午前 10:15

David が追加したプライマリ画像の色の検索のためのバックフィルかもしれません。

最終的には完了し、安定した状態に戻ります。

バックフィルのためにすべての画像を処理する必要があります。すべての画像のデフォルトの色を白などに強制することで回避できるかもしれません。

hnaseri · 2022 年 10 月 6 日午前 10:43

私の見る限り、

github.com/discourse/discourse

app/jobs/scheduled/periodical_updates.rb

d0243f741


      
                end
          
                offset = (SiteSetting.max_new_topics).to_i
                last_new_topic = Topic.order('created_at desc').offset(offset).select(:created_at).first
                if last_new_topic
                  SiteSetting.min_new_topics_time = last_new_topic.created_at.to_i
                end
          
                Category.auto_bump_topic!
          
                Upload.backfill_dominant_colors!(25)
          
                nil
              end
          
            end
          
          end

これは15分あたり25枚の画像で動作しています。そうですよね？これは非常に無視できるはずです。私は毎分数千ものファイルが検索されているのを見ています。

また、6か月前の帯域幅を見ると、同じような動作が見られます。したがって、それは他の何かだと思います。

しかし、ディスコースのジョブかそれに類するものによって実行されていることはほぼ確実です。なぜなら、ディスコースアプリを停止すると、帯域幅は消えるからです。しかし、ディスコースのnginxアプリを停止しただけでは、帯域幅は残ります。

sam · 2022 年 10 月 6 日午後 12:07

/sidekiqで実行中のジョブを確認してください。すべてのタブをクリックしてください。

hnaseri · 2022 年 10 月 6 日午後 12:51

ジョブは実行されていません。。ここにリストされていない他のジョブはありますか？

それとも、コンテナ内にファイルをインデックス化しようとしているものがあるのでしょうか？

Falco · 2022 年 10 月 6 日午後 3:03

バックグラウンドロジックはすべてSidekiqジョブで実行されます。ジョブが実行されておらず、ディスクI/Oが高い場合は、ユーザーがウェブサイトを訪問していて、nginxが画像を配信している可能性がありますか？

静的アセットの前面にキャッシュCDNがありますか？

hnaseri · 2022 年 10 月 6 日午後 3:08

以前にテストしました。

したがって、ウェブサイトへのアクセスが原因ではありません。もしそうであれば、nginxを停止したときにトラフィックはなくなるはずです。

Falco · 2022 年 10 月 6 日午後 3:09

Linux の検査ツールを使用して、具体的にどの PID と syscall が実行されているかを確認する必要があります。

hnaseri · 2022 年 10 月 6 日午後 7:52

@Falco @sam 原因が見つかったと思います。

まず、ディスコースアプリを再起動して、継続的なトラフィックをなくしました。次に、管理パネルに移動し、一括レポートのセクションに移動しました。レポートがここで正しく表示されないのは長い間続いています。

レポートがタイムアウトした直後に、ネットワーク帯域幅の増加が見られます。そして、エラーログに次のエラーが表示されます。


'hijack admin/reports bulk ' is still running after 90 seconds on db default, this process may need to be restarted!

何が間違っているのでしょうか？

Falco · 2022 年 10 月 6 日午後 7:54

データベースは同じNASストレージにありますか？

hnaseri · 2022 年 10 月 6 日午後 7:54

いいえ、データベースは物理SSDディスク上にあります。

アップロードフォルダのみがNAS上にあります。

Falco · 2022 年 10 月 6 日午後 7:55

それらの間に関連性はないということですね。戻って

hnaseri · 2022 年 10 月 6 日午後 8:00

実際には、関連性があるのではないかと思います。私のテスト環境では、使用済みスペースを計算しています。

多数のファイルがあるNASフォルダの使用済みスペースの計算は、非常に時間がかかり、高帯域幅の根本原因になると考えています。

合っていますか？

Falco · 2022 年 10 月 6 日午後 10:30

ネットワーク共有で

df -Pk

df -P

du -s

を実行すると、かなりの時間がかかりますか？

hnaseri · 2022 年 10 月 6 日午後 10:56

これら2つは即座に実行されました

df -Pk

df -P

しかし、du -s は上記で報告したのと同様の動作になりました。

そして、約5分間実行されても終了せず、手動で終了する必要がありました。

Falco · 2022 年 10 月 7 日午前 1:14

なるほど。そのレポート結果はキャッシュされていますが、完了せず、ネットワーク共有が遅すぎるためにキャッシュできないのだと思います。

hnaseri · 2022 年 10 月 7 日午前 4:03

これを防ぐために何かできることはありますか？たとえば、ディスクサイズを計算しないS3アップロードのように扱いますか？

トピック		返信	表示
Huge amount of storage transactions Self-hosting	12	1733	2020 年 5 月 25 日
Disk usage spike during backup, Discourse crashed hard :-( Self-hosting server-resources	21	2723	2020 年 7 月 23 日
S3 image bandwidth costs are getting annoying Self-hosting s3 , hosting	30	4510	2025 年 10 月 23 日
Discourse overloaded real traffic or DDOS? 100% CPU usage despite of decent traffic and high specs server Self-hosting server-resources	18	2507	2021 年 9 月 25 日
Our disk space disappeared - how to find who/where? Self-hosting server-resources	12	2678	2020 年 3 月 8 日

NASストレージにおける大量のネットワークトラフィック

関連トピック