Ihre Redis-Netzwerkverbindung funktioniert äußerst schlecht

markersocial · 12. Dezember 2024 um 22:26

Ich bekomme ständig diese Meldung in den Protokollen – mit Werten zwischen ca. 100.000 und ca. 1,35 Mio. – aber die Werte nahe 100.000 scheinen recht häufig zu sein:

Ihre Redis-Netzwerkverbindung ist extrem schlecht. Die letzten RTT-Messwerte waren [97069, 103986, 98459, 100762, 381617], idealerweise sollten diese < 1000 sein. Stellen Sie sicher, dass Redis in derselben AZ oder demselben Rechenzentrum wie Sidekiq läuft. Wenn diese Werte nahe 100.000 liegen, bedeutet dies, dass Ihr Sidekiq-Prozess möglicherweise CPU-gesättigt ist; reduzieren Sie Ihre Nebenläufigkeit und/oder siehe https://github.com/mperham/sidekiq/discussions/5039

Das deutet darauf hin, dass Redis vielleicht nicht genug CPU nutzen kann? Auf dem Server selbst scheint es aber genügend Spielraum für CPU und RAM zu geben.

Außerdem:
Sidekiq verbraucht zu viel Speicher (verwendet: 3570,19M) für 'www.example.com', startet neu

Dies verwendet die All-in-One-App.yml mit Discourse Stable 3.3.2.

Aus der app.yml:

UNICORN_SIDEKIQS: 9
DISCOURSE_SIDEKIQ_WORKERS: 5

Ich habe diese Konfiguration auch auf dem Host hinzugefügt:

Michael K Johnson:

Kernel-Konfiguration

Redis (eine der Schlüsselkomponenten, auf denen Discourse aufbaut) empfiehlt dringend, transparente riesige Seiten bei Verwendung von Festplattenspeicher zu deaktivieren (was Discourse tut), und ich erlaube auch Speicher-Overcommit.
echo 'sys.kernel.mm.transparent_hugepage.enabled=never' > /etc/sysctl.d/10-huge-pages.conf
echo 'vm.overcommit_memory=1' > /etc/sysctl.d/90-vm_overcommit_memory.conf
sysctl --system

Sidekiq-Dashboard-Informationen:

Es scheint, dass Redis nicht in der Lage ist, mehr als 1024M Speicher zu nutzen.

Wenn jemand Ideen hat, wäre ich dankbar!

markersocial · 19. Dezember 2024 um 14:38

Um dies zu verfolgen, habe ich dasselbe Problem mit Jobs::PostAlert:

Mit diesen Jobs, die oft bis zu 15 Minuten dauern, wenn 4 Sidekiqs mit 5 (Standard) Threads verwendet werden, mit aktuellen Tests. Es scheint, dass die Geschwindigkeit der Jobs pro Sekunde für Sidekiq hauptsächlich davon abhängt, wie viele dieser Jobs gleichzeitig ausgeführt werden und wie viele Threads für die anderen Jobs frei sind.

Die Erhöhung von Sidekiqs auf 6 oder höher (5 Threads) erhöht die Geschwindigkeit der Warteschlangenbereinigung, aber Postgres stürzt regelmäßig ab (ich vermute, wegen zu vieler gleichzeitig ausgeführter Jobs::PostAlert-Jobs).

Dies ist auf Stable 3.3.2. Die Änderungen und Korrekturen aus dem verlinkten Thread scheinen bereits in 3.3.2 implementiert zu sein, wenn ich mich nicht irre.

supermathie · 19. Dezember 2024 um 16:11

Postgres sollte niemals abstürzen und deutet im Allgemeinen auf einen Postgres-Fehler oder ein größeres Problem hin.

Haben Sie Protokolle?

Ed_S · 19. Dezember 2024 um 17:10

Haben Sie den Server neu gestartet, seit Sie diese Kernel-Konfigurationsänderungen vorgenommen haben?

Vielleicht wäre

lscpu

auch hilfreich

Falco · 19. Dezember 2024 um 17:21

Sie sollten UNICORN_SIDEKIQS niemals so hoch einstellen, sondern nur die Worker erhöhen, aber

Das sollte niemals passieren.

Die Möglichkeiten sind:

Sie sind ressourcenbeschränkt, weil entweder
a) Ihre Website die Serverressourcen überlastet hat
b) Sie Ressourcen falsch zuweisen
Es gibt einen Fehler irgendwo im Stack

Ich würde anfangen,

UNICORN_SIDEKIQS: 1
DISCOURSE_SIDEKIQ_WORKERS: 20

einzustellen, was Ihren Server entlasten sollte.

Für weitere Informationen müssen Sie die betreffenden Jobs in einer PostgreSQL-Konsole ausführen und melden, wo der Engpass liegt.

markersocial · 16. Februar 2026 um 07:10

Entschuldigung für mein Verschwinden und vielen Dank für die Antworten.

Ich glaube, dass das Hauptproblem für die Langsamkeit von Redis darin bestand, dass THP immer noch aktiviert war (obwohl ich dachte, es sei deaktiviert gewesen):

Für das Abstürzen von PG war die Hauptlösung für mich, dies zu app.yml hinzuzufügen:

docker_args:
  - "--shm-size=34g"

Wobei der Wert auf db_shared_buffers + 2GB gesetzt ist, wobei db_shared_buffers 25 % des gesamten RAMs des Host-Rechners beträgt.

Überschreiben von standardmäßig 512m:

github.com/discourse/discourse_docker

launcher

4ae1f6914


      
               if [ -z "$SKIP_MAC_ADDRESS" ] ; then
                mac_address="--mac-address $($docker_path run $user_args -i --rm -a stdout -a stderr $image /bin/sh -c "echo $hostname | md5sum | sed 's/^\(..\)\(..\)\(..\)\(..\)\(..\).*$/02:\1:\2:\3:\4:\5/'")"
               fi
          
               if [ ! -z "$START_CMD_ONLY" ] ; then
                 docker_path="true"
               fi
          
               set -x
          
               $docker_path run --shm-size=512m $links $attach_on_run $restart_policy "${env[@]}" "${labels[@]}" -h "$hostname" \
                  -e DOCKER_HOST_IP="$docker_ip" --name $config -t "${ports[@]}" $volumes $mac_address $user_args \
                  $run_image $boot_command
          
             )
             exit 0
          
          }
          
          run_run() {
            set_template_info

github.com/discourse/discourse_docker

launcher

4ae1f6914


      
          
          }
          
          run_run() {
            set_template_info
            set_volumes
            set_links
            set_run_image
          
            unset ERR
            (exec $docker_path run --rm --shm-size=512m $user_args $links "${env[@]}" -e DOCKER_HOST_IP="$docker_ip" -i -a stdin -a stdout -a stderr $volumes $run_image \
              /bin/bash -c "$run_command") || ERR=$?
          
            if [[ $ERR > 0 ]]; then
              exit 1
            fi
          }
          
          run_bootstrap() {
            set_template_info

github.com/discourse/discourse_docker

launcher

4ae1f6914


      
              pups_command="$pups_command git pull && git checkout $pups_version &&"
            fi
            pups_command="$pups_command /pups/bin/pups --stdin"
          fi
          
          echo $pups_command
          
          declare -i BOOTSTRAP_EXITCODE
          rm -f $cidbootstrap
          
          echo "$input" | $docker_path run --shm-size=512m $user_args $links "${env[@]}" -e DOCKER_HOST_IP="$docker_ip" --cidfile "$cidbootstrap" -i -a stdin -a stdout -a stderr $volumes $image \
            /bin/bash -c "$pups_command"
          BOOTSTRAP_EXITCODE=$?
          
          CONTAINER_ID=$(cat "$cidbootstrap")
          rm -f "$cidbootstrap"
          
          # magic exit code that indicates a retry
          if [[ $BOOTSTRAP_EXITCODE -eq 77 ]]; then
            $docker_path rm "$CONTAINER_ID"
            exit 77

Ed_S · 16. Februar 2026 um 12:13

Ich habe mir Ihren Beitragsverlauf angesehen und sehe in Sehr langsames Sidekiq-Problem … riesige Mengen ungelesener Benutzerbenachrichtigungen, dass Sie einen Server mit 32 Kernen und 128 GB hatten, mit einer sehr großen und aktiven Benutzerbasis. In diesem Zusammenhang verstehe ich, warum 34G keine so große Zahl ist! Zum besseren Verständnis wäre es jedoch hilfreich (und interessant) zu wissen, wie groß Ihr Setup ist – möglicherweise hier oder sogar in Ihrer Biografie? (vielleicht tägliche und monatlich aktive Benutzer, Größe der Datenbank-Backups, Serverkonfiguration in Bezug auf RAM, Swap, Festplatte, CPUs.) Vielleicht sogar ein Thread, in dem wir einfach unsere Statistiken teilen – große und kleine.

Thema		Antworten	Aufrufe
Redis used_memory limited to 1024mb? Support	2	206	16. Februar 2026
Could sidekiq queue be reason for 500 errors? Self-hosting server-resources	30	4093	13. Juni 2018
Sidekiq is consuming too much memory, restarting Self-hosting	38	9112	13. Oktober 2020
Redis connection timed out Self-hosting	29	9844	2. Juli 2018
Locks up while running Sidekiq after migration Self-hosting	6	2424	24. Dezember 2017

Ihre Redis-Netzwerkverbindung funktioniert äußerst schlecht

Verwandte Themen