Problem: Extrem langsame Sidekiq-Verarbeitung nach großen Importen auf Multisite-Instance

emonunix · 23. April 2025 um 17:10

Wir betreiben mehrere Discourse-Sites mit Multisite unter einer einzigen App. Kürzlich haben wir eine Charge großer Benutzerimporte durchgeführt (Hunderttausende von Benutzern über 6 Sites). Nach den Importen verarbeitet Sidekiq Hintergrundjobs sehr langsam. Das Sidekiq-Dashboard zeigt einen riesigen Rückstand an, und Jobs werden viel langsamer abgearbeitet als erwartet.

Umgebungsdetails:

Die VM wurde auf 16 CPUs / 16 GB RAM aufgerüstet.
In der Sidekiq-Oberfläche sehen wir jedoch nur 5 Threads, und es scheint, als würde nur ein kleiner Teil der Ressourcen genutzt.
Die Hauptimportwarteschlange („nursingjobs“ als Multisite-Mutter) verarbeitet Jobs für alle untergeordneten Sites, aber der Jobdurchsatz ist sehr gering.
Servermetriken: CPU manchmal bei 80–90 %, Speicher bei etwa 6,7/7,2 GB.

Wir möchten:

Die Sidekiq/Hintergrundjob-Verarbeitung beschleunigen, um große Rückstände nach dem Import zu beseitigen.
Sicherstellen, dass Discourse alle verfügbaren Ressourcen (CPU/RAM) nutzt.
Verstehen, ob es Thread-/Prozesslimits gibt, die angepasst werden müssen.

Fragen:

Was ist der beste Weg, Sidekiq/Discourse für hohen Durchsatz nach dem Import zu konfigurieren?
Was sind die empfohlenen Einstellungen für UNICORN_SIDEKIQS und DISCOURSE_SIDEKIQ_WORKERS auf großen Mehrkernsystemen?
Gibt es Postgres- oder andere app.yml-Einstellungen, die wir anpassen sollten, um DB-Poolfehler zu vermeiden, wenn die Sidekiq-Concurrency erhöht wird?
Gibt es Best Practices, um riesige Sidekiq-Rückstände nach Importen schnell und sicher zu beseitigen?

Sidekiq-Statistiken/Screenshots sind verfügbar, falls hilfreich!

supermathie · 23. April 2025 um 18:41

Die Antwort auf all diese Fragen ist mehr oder weniger, die Erhöhung von DISCOURSE_SIDEKIQ_WORKERS.

Ich würde das auf vielleicht 32 hochsetzen, da du weißt, dass du viel freie CPU-Ressourcen hast. Wenn nach einer Weile noch viel CPU verfügbar ist, kannst du es gerne noch weiter erhöhen.

Für den normalen Betrieb könntest du es wahrscheinlich wieder auf etwa 8 oder 12 reduzieren.

Stelle sicher, dass du genug max_connections für Postgres hast. Du hast es wahrscheinlich schon erhöht, da du Multisite betreibst, aber behalte es im Auge.

emonunix · 23. April 2025 um 19:56

Danke @supermathie, es funktioniert jetzt.
Ich habe die Konfiguration wie folgt aktualisiert:

  UNICORN_WORKERS: 8
  UNICORN_SIDEKIQS: 7
  DISCOURSE_SIDEKIQ_WORKERS: 10
  DISCOURSE_DB_POOL: 20

Und die CPU erhöht auf:

8 vCPU
16 GB Arbeitsspeicher

Thema		Antworten	Aufrufe
Optimizing a Large Discourse Multisite: Database and Sidekiq Bottlenecks Self-hosting hosting , multisite	5	203	22. Oktober 2025
Sidekiq During Import Support	4	855	29. Mai 2020
Lot of sidekiq jobs during data import Support	3	1618	2. April 2019
UNICORN_WORKERS vs UNICORN_SIDEKIQS, DISCOURSE_DB_POOL? Self-hosting	7	2616	21. November 2020
Very slow sidekiq 5 processed per minute Support	15	705	23. Dezember 2020

Problem: Extrem langsame Sidekiq-Verarbeitung nach großen Importen auf Multisite-Instance

Fragen:

Verwandte Themen