あなたのRedisネットワーク接続のパフォーマンスが非常に悪いです

markersocial · 2024 年 12 月 12 日午後 10:26

ログで一貫してこれが発生しています。値は 100k から 1.35m の間ですが、100k 付近の読み取り値はかなり一般的です。

Redis のネットワーク接続のパフォーマンスが非常に低下しています。最後の RTT 測定値は [97069, 103986, 98459, 100762, 381617] でした。理想的には 1000 未満であるべきです。 Redis が Sidekiq と同じ AZ またはデータセンターで実行されていることを確認してください。これらの値が 100,000 に近い場合、Sidekiq プロセスが CPU で飽和している可能性があります。同時実行性を減らすか、https://github.com/mperham/sidekiq/discussions/5039 を参照してください。

これは、Redis が十分な CPU を使用できていないことを示唆しているのでしょうか？サーバー自体の CPU と RAM には十分な余裕があるように見えます。

また：
Sidekiq がメモリを過剰に使用しています (使用量: 3570.19M)。'www.example.com' のために再起動します。

これは、Discourse stable 3.3.2 のオールインワン app.yml を使用しています。

app.yml から：

UNICORN_SIDEKIQS: 9
DISCOURSE_SIDEKIQ_WORKERS: 5

ホストにもこの構成を追加しました：

Michael K Johnson:

カーネル設定

Redis (Discourse の基盤となる主要コンポーネントの 1 つ) は、ディスク永続化を使用する場合に透過的な巨大ページを無効にすることを強く推奨しています (Discourse はこれを行います)。また、メモリのオーバーコミットも許可しています。
echo 'sys.kernel.mm.transparent_hugepage.enabled=never' > /etc/sysctl.d/10-huge-pages.conf
echo 'vm.overcommit_memory=1' > /etc/sysctl.d/90-vm_overcommit_memory.conf
sysctl --system

Sidekiq ダッシュボードの情報：

Redis が 1024M のメモリ使用量を超えることができないように見えます。

何かアイデアがあれば、ぜひ教えてください！

markersocial · 2024 年 12 月 19 日午後 2:38

これに続いて、Jobs::PostAlert でも同様の問題が発生しています。

これらのジョブは、4つのSidekiqと5つの（デフォルトの）スレッドを使用している場合、現在のテストでは15分までかかることがよくあります。Sidekiqの1秒あたりのジョブ処理速度は、主にそれらのジョブが同時にいくつ実行されているか、そして他のジョブにいくつのスレッドが空いているかに依存するようです。

Sidekiqを6以上に増やす（スレッド5）とキューのクリア速度は上がりますが、Postgresはかなり定期的にクラッシュします（おそらく、同時に実行されるJobs::PostAlertジョブが多すぎるためだと推測されます）。

これはStable 3.3.2での話です。リンクされたスレッドからの変更と修正は、私の間違いでなければ、すでに3.3.2に実装されているようです。

supermathie · 2024 年 12 月 19 日午後 4:11

Postgresは決してクラッシュするべきではなく、一般的にはPostgresのバグか、何らかのより大きな問題を示しています。

ログはありますか？

Ed_S · 2024 年 12 月 19 日午後 5:10

カーネル設定の変更後、サーバーを再起動しましたか？

lscpu

も役立つかもしれません

Falco · 2024 年 12 月 19 日午後 5:21

UNICORN_SIDEKIQSをそれほど高く設定しないでください。ワーカーのみを増やしてください。

これは決して起こるべきではありません。

考えられる原因は以下の通りです。

リソースが不足している
a) サイトがサーバーリソースを超えて成長した
b) リソースの割り当てを誤っている
スタックにバグがある

まず、以下のように設定してみてください。

UNICORN_SIDEKIQS: 1
DISCOURSE_SIDEKIQ_WORKERS: 20

これにより、サーバーからRAMが解放されるはずです。

さらに詳しい情報が必要な場合は、問題のジョブをPostgreSQLコンソールで実行し、ボトルネックが何であるかを報告してください。

markersocial · 2026 年 2 月 16 日午前 7:10

お待たせして申し訳ありません、そしてご返信ありがとうございます。

Redisが遅かった主な原因は、THPがまだ有効になっていたことだと考えています（そう思っていたのですが）：

PGのクラッシュについては、私にとっての主な解決策は、app.ymlにこれを追加することでした。

docker_args:
  - "--shm-size=34g"

値をdb_shared_buffers + 2GBに設定し、db_shared_buffersはホストマシンの合計RAMの25%です。

デフォルトの512mを上書きしています：

github.com/discourse/discourse_docker

launcher

4ae1f6914


      
               if [ -z "$SKIP_MAC_ADDRESS" ] ; then
                mac_address="--mac-address $($docker_path run $user_args -i --rm -a stdout -a stderr $image /bin/sh -c "echo $hostname | md5sum | sed 's/^\(..\)\(..\)\(..\)\(..\)\(..\).*$/02:\1:\2:\3:\4:\5/'")"
               fi
          
               if [ ! -z "$START_CMD_ONLY" ] ; then
                 docker_path="true"
               fi
          
               set -x
          
               $docker_path run --shm-size=512m $links $attach_on_run $restart_policy "${env[@]}" "${labels[@]}" -h "$hostname" \
                  -e DOCKER_HOST_IP="$docker_ip" --name $config -t "${ports[@]}" $volumes $mac_address $user_args \
                  $run_image $boot_command
          
             )
             exit 0
          
          }
          
          run_run() {
            set_template_info

github.com/discourse/discourse_docker

launcher

4ae1f6914


      
          
          }
          
          run_run() {
            set_template_info
            set_volumes
            set_links
            set_run_image
          
            unset ERR
            (exec $docker_path run --rm --shm-size=512m $user_args $links "${env[@]}" -e DOCKER_HOST_IP="$docker_ip" -i -a stdin -a stdout -a stderr $volumes $run_image \
              /bin/bash -c "$run_command") || ERR=$?
          
            if [[ $ERR > 0 ]]; then
              exit 1
            fi
          }
          
          run_bootstrap() {
            set_template_info

github.com/discourse/discourse_docker

launcher

4ae1f6914


      
              pups_command="$pups_command git pull && git checkout $pups_version &&"
            fi
            pups_command="$pups_command /pups/bin/pups --stdin"
          fi
          
          echo $pups_command
          
          declare -i BOOTSTRAP_EXITCODE
          rm -f $cidbootstrap
          
          echo "$input" | $docker_path run --shm-size=512m $user_args $links "${env[@]}" -e DOCKER_HOST_IP="$docker_ip" --cidfile "$cidbootstrap" -i -a stdin -a stdout -a stderr $volumes $image \
            /bin/bash -c "$pups_command"
          BOOTSTRAP_EXITCODE=$?
          
          CONTAINER_ID=$(cat "$cidbootstrap")
          rm -f "$cidbootstrap"
          
          # magic exit code that indicates a retry
          if [[ $BOOTSTRAP_EXITCODE -eq 77 ]]; then
            $docker_path rm "$CONTAINER_ID"
            exit 77

Ed_S · 2026 年 2 月 16 日午後 12:13

あなたの投稿履歴を遡って確認したところ、Very slow Sidekiq issue … massive numbers of unread user notificationsで、32コア128GBのサーバーで、非常に大規模でアクティブなユーザーベースで運用していたことがわかりました。その文脈からすると、34Gがそれほど大きな数値ではないことは理解できます！ただし、参考として、あなたのセットアップの規模（日次および月次のアクティブユーザー数、データベースバックアップのサイズ、サーバー設定のRAM、スワップ、ディスク、CPUなど）を知ることが役立つ（そして興味深い）かもしれません。あるいは、大小さまざまな統計を共有するスレッドを立てるのも良いかもしれません。

トピック		返信	表示
Redis used_memory limited to 1024mb? Support	2	205	2026 年 2 月 16 日
Could sidekiq queue be reason for 500 errors? Self-hosting server-resources	30	4091	2018 年 6 月 13 日
Sidekiq is consuming too much memory, restarting Self-hosting	38	9111	2020 年 10 月 13 日
Redis connection timed out Self-hosting	29	9841	2018 年 7 月 2 日
Locks up while running Sidekiq after migration Self-hosting	6	2423	2017 年 12 月 24 日

あなたのRedisネットワーク接続のパフォーマンスが非常に悪いです

関連トピック