您的 Redis 网络连接性能极差

markersocial · 2024 年12 月 12 日 22:26

我一直在日志中看到这个——数值在 100k 到 135 万之间——但接近 100k 的读数似乎相当普遍：

您的 Redis 网络连接性能极差。
上次的 RTT 读数是 [97069, 103986, 98459, 100762, 381617]，理想情况下应该小于 1000。
确保 Redis 与 Sidekiq 运行在同一个可用区或数据中心。
如果这些值接近 100,000，则意味着您的 Sidekiq 进程可能
CPU 过载；请降低您的并发度以及/或参阅 https://github.com/mperham/sidekiq/discussions/5039

这是否表明 Redis 无法使用足够的 CPU？尽管服务器本身有充足的 CPU 和内存空间。

另外：
Sidekiq 正在为 'www.example.com' 使用过多内存（使用量：3570.19M），正在重启

这是在使用 Discourse stable 3.3.2 的一体化 app.yml。

来自 app.yml：

UNICORN_SIDEKIQS: 9
DISCOURSE_SIDEKIQ_WORKERS: 5

我还向主机添加了此配置：

Michael K Johnson:

Kernel configuration

Redis（Discourse 构建的关键组件之一）强烈建议在启用磁盘持久化时禁用透明大页（Discourse 会这样做），我也允许内存超额提交。
echo 'sys.kernel.mm.transparent_hugepage.enabled=never' > /etc/sysctl.d/10-huge-pages.conf
echo 'vm.overcommit_memory=1' > /etc/sysctl.d/90-vm_overcommit_memory.conf
sysctl --system

Sidekiq 仪表板信息：

看起来 Redis 的内存使用量似乎无法超过 1024M。

如果有人有什么想法，我将不胜感激！

markersocial · 2024 年12 月 19 日 14:38

为了跟进这个问题，我遇到了与 Jobs::PostAlert 相同的问：

在使用 4 个 Sidekiq 和 5 个（默认）线程进行当前测试时，这些作业通常需要 15 分钟。看来 Sidekiq 的每秒作业速度主要取决于同时运行的作业数量以及有多少线程可用于其他作业。

将 Sidekiq 增加到 6 个或更多（5 个线程）将提高队列清除速度，但 PostgreSQL 会经常崩溃（我猜测是由于同时运行了过多的 Jobs::PostAlert 作业）。

这是 Stable 3.3.2 版本。如果我没记错的话，来自链接线程的更改和修复似乎已在 3.3.2 版本中实现。

supermathie · 2024 年12 月 19 日 16:11

Postgres 永远不应该崩溃，这通常表明存在 Postgres 错误或某种更大的问题。

您有日志吗？

Ed_S · 2024 年12 月 19 日 17:10

自进行那些内核配置更改以来，您是否已重新启动服务器？

也许

lscpu

也会有帮助

Falco · 2024 年12 月 19 日 17:21

你不应该将 UNICORN_SIDEKIQS 调得这么高，只增加工作进程但

这不应该发生。

可能的原因是：

你受到资源限制，因为：
a) 你的网站已经超出了服务器资源的承载能力
b) 你错误地分配了资源
堆栈中存在 bug

我建议你改为：

UNICORN_SIDEKIQS: 1
DISCOURSE_SIDEKIQ_WORKERS: 20

这应该能释放你服务器的一些内存。

要获取更多信息，你需要在一个 PostgreSQL 控制台中运行有问题的作业，并报告瓶颈是什么。

markersocial · 2026 年2 月 16 日 07:10

抱歉消失了一段时间，感谢大家的回复。

我认为 Redis 变慢的主要原因是 THP 仍然启用（我原以为不是这样）：

对于 PG 崩溃，对我来说主要的解决方案是在 app.yml 中添加这个：

docker_args:
  - "--shm-size=34g"

该值设置为 db_shared_buffers + 2GB，其中 db_shared_buffers 是主机总内存的 25%。

覆盖默认的 512m：

github.com/discourse/discourse_docker

launcher

4ae1f6914


      
               if [ -z "$SKIP_MAC_ADDRESS" ] ; then
                mac_address="--mac-address $($docker_path run $user_args -i --rm -a stdout -a stderr $image /bin/sh -c "echo $hostname | md5sum | sed 's/^\(..\)\(..\)\(..\)\(..\)\(..\).*$/02:\1:\2:\3:\4:\5/'")"
               fi
          
               if [ ! -z "$START_CMD_ONLY" ] ; then
                 docker_path="true"
               fi
          
               set -x
          
               $docker_path run --shm-size=512m $links $attach_on_run $restart_policy "${env[@]}" "${labels[@]}" -h "$hostname" \
                  -e DOCKER_HOST_IP="$docker_ip" --name $config -t "${ports[@]}" $volumes $mac_address $user_args \
                  $run_image $boot_command
          
             )
             exit 0
          
          }
          
          run_run() {
            set_template_info

github.com/discourse/discourse_docker

launcher

4ae1f6914


      
          
          }
          
          run_run() {
            set_template_info
            set_volumes
            set_links
            set_run_image
          
            unset ERR
            (exec $docker_path run --rm --shm-size=512m $user_args $links "${env[@]}" -e DOCKER_HOST_IP="$docker_ip" -i -a stdin -a stdout -a stderr $volumes $run_image \
              /bin/bash -c "$run_command") || ERR=$?
          
            if [[ $ERR > 0 ]]; then
              exit 1
            fi
          }
          
          run_bootstrap() {
            set_template_info

github.com/discourse/discourse_docker

launcher

4ae1f6914


      
              pups_command="$pups_command git pull && git checkout $pups_version &&"
            fi
            pups_command="$pups_command /pups/bin/pups --stdin"
          fi
          
          echo $pups_command
          
          declare -i BOOTSTRAP_EXITCODE
          rm -f $cidbootstrap
          
          echo "$input" | $docker_path run --shm-size=512m $user_args $links "${env[@]}" -e DOCKER_HOST_IP="$docker_ip" --cidfile "$cidbootstrap" -i -a stdin -a stdout -a stderr $volumes $image \
            /bin/bash -c "$pups_command"
          BOOTSTRAP_EXITCODE=$?
          
          CONTAINER_ID=$(cat "$cidbootstrap")
          rm -f "$cidbootstrap"
          
          # magic exit code that indicates a retry
          if [[ $BOOTSTRAP_EXITCODE -eq 77 ]]; then
            $docker_path rm "$CONTAINER_ID"
            exit 77

Ed_S · 2026 年2 月 16 日 12:13

我回顾了您的发帖历史，在 Very slow Sidekiq issue … massive numbers of unread user notifications 中看到您运行的是一个 32 核 128 GB 的服务器，拥有非常庞大且活跃的用户群。因此，在这种情况下，我明白为什么 34G 并不是一个很大的数字！不过，为了提供背景信息，了解您的设置规模可能会有所帮助（也很有趣）——可能在这里，甚至在您的个人简介中？（也许是每日和每月活跃用户数、数据库备份大小、服务器配置中的内存、交换空间、磁盘、CPU。）甚至可以开一个帖子，专门分享我们的统计数据——无论大小。

话题		回复	浏览量
Redis used_memory limited to 1024mb? Support	2	205	2026 年2 月 16 日
Could sidekiq queue be reason for 500 errors? Self-hosting server-resources	30	4091	2018 年6 月 13 日
Sidekiq is consuming too much memory, restarting Self-hosting	38	9111	2020 年10 月 13 日
Redis connection timed out Self-hosting	29	9841	2018 年7 月 2 日
Locks up while running Sidekiq after migration Self-hosting	6	2423	2017 年12 月 24 日

您的 Redis 网络连接性能极差

相关话题