Wir haben gerade von 3.0.6 auf 3.1.2 aktualisiert und sehen viele 503-Fehler an hauptsächlich 3 Stellen:
- Viele Avatare können nicht geladen werden
- Bild-Uploads funktionieren nur manchmal
- Sehen auch viele Fehler für
topics/timings
Ich habe die Serverprotokolle überprüft, und die meisten 503er werden nicht einmal in production.log angezeigt, aber nginx ist voll davon. Da ich dachte, es könnte sich um eine Ratenbegrenzung von nginx handeln, habe ich versucht, die templates/web.ratelimited.template.yml nicht zu verwenden, aber es schien nicht zu helfen. Ich sehe immer noch eine hohe Anzahl von Anfragen, die mit 503 beantwortet werden, hauptsächlich user_avatars/show, und soweit ich das beurteilen kann, sieht production.log sie überhaupt nicht.
Nichts Ungewöhnliches in Sidekiq bemerkt. Allerdings gab es in /logs Fehler mit:
'hijack user_avatars show ' läuft immer noch nach 90 Sekunden auf db default, dieser Prozess muss möglicherweise neu gestartet werden!
aber das war ein paar Stunden her und ich habe die Instanz seitdem ein paar Mal neu erstellt und sie sind nicht wieder aufgetaucht.
Diese Instanz verwendet SSO, daher kommen die Avatare (URL) von dort. Wir verwenden S3 für Bilder.
Ich bin etwas ratlos, was die Ursache ist, und mir gehen die Ideen aus.
Irgendwelche Hinweise, wo/was ich untersuchen könnte?
