Gute Arbeit, @RGJ!
Während wir auf eine Lösung warten, wäre es nebenbei gut, wenn dieses Problem nicht die Kaskade von Problemen verursachen würde, die ich erlebt habe und die mein Forum fast vollständig zum Absturz brachten. Insbesondere:
- Die E-Mail-Fehler scheinen extrem schnell wiederholt zu werden, was dazu führt, dass die Sidekiq-Warteschlange explodiert und die CPU-Auslastung durch diese Aufgaben bei ~100 % liegt.
- Außerdem verursachte etwas (entweder Abstürze oder Neustarts), dass Redis riesige temporäre Dateien schrieb, die vermutlich den Zustand der Sidekiq-Warteschlange enthielten. Obwohl diese sicher zu entfernen waren, füllten sie schnell die Festplatte, was weitere Abstürze verursachte und so weiter. Ich hatte etwas anderen Speicherplatz, den ich freimachen konnte, um das Forum neu zu starten und herauszufinden, was los war, aber das ist möglicherweise nicht bei jedem der Fall. (Es ist auch einigermaßen schwierig zu bestätigen, dass in diesem Fall die temporären Redis-Dateien tatsächlich sicher gelöscht werden können.)
Ich vermute, dass die einfachste Lösung darin besteht, die Wiederholung fehlgeschlagener E-Mail-Jobs zu verlangsamen – oder zumindest bei denen, die keine zeitlichen Einschränkungen haben, wie z. B. Passwort-Resets. Dies scheint angemessen zu sein, da E-Mail-Probleme wahrscheinlich nicht schnell gelöst werden und die meisten / alle Mailer ihre eigenen Wiederholungen durchführen, sobald sie eine Nachricht erhalten.