In der letzten Woche haben wir auf verschiedenen Foren drei Sidekiq-Instanzen beobachtet, die feststeckten. Es geschah nichts Besonderes, Sidekiq verarbeitete einfach keine Arbeit mehr und zeigte an, dass 5 von 5 Jobs verarbeitet wurden.
Eine interessante Gemeinsamkeit war, dass unter den Jobs ein kritischer BotInput-Job war. Dies ist zwar ein ziemlich häufiger Job, aber er fällt dennoch auf.
Nach einem Neustart von Sidekiq funktioniert alles wieder normal. Das manuelle Anfordern eines Jobs mit denselben Parametern führt nicht erneut zu einem Hängenbleiben. Es gibt nichts Besonderes an dem spezifischen Beitrag, für den er aufgerufen wurde.
Hat jemand eine Idee, wie wir herausfinden können, was hier vor sich geht?
[quote=„Richard – Communiteq, post:1, topic:352661, username:RGJ“]Es war nur so, dass Sidekiq keine Arbeit verarbeitete und 5 von 5 Jobs als verarbeitet anzeigte.
[/quote]
Haben Sie einen Screenshot von dem, was Sie im Dashboard sehen?
Wenn möglich, versuchen Sie bitte, dem Sidekiq-Prozess das TTIN-Signal zu senden und stellen Sie den Backtrace hier zur Verfügung.
Ich habe seit einem Forum-Upgrade vor einem Monat Probleme mit Sidekiq. Welchen Befehl verwenden Sie, um Sidekiq neu zu starten? Nur ein sv restart sidekiq?
Ich sehe das in den letzten Tagen. Schließlich hören alle Jobs auf zu laufen. Zuvor habe ich neu gestartet, aber ist es sicher, die kritische Warteschlange zu löschen? Ist es eine Redis-Warteschlange?
Ich bin auf dem neuesten Stand bei 3.5.0.beta1-dev.
Nur eine wilde Vermutung, aber manchmal, wenn ich mit dem Bot chatte, hört er auf zu antworten, also aktualisiere ich die Seite oder gebe auf. Vielleicht hinterlassen diese Fälle einen hängenden Job?
Diese Jobs sind asynchron, sie würden nicht einmal bemerken, dass Sie das getan haben.
Es ist interessant zu hören, dass Sie dieses Problem auch bei Jobs::BotInput haben. Wir sehen dieses Problem nur bei einer kleinen Teilmenge all unserer Server (ein paar Prozent) und es scheint sich um die Instanzen zu handeln, die den narrativen Bot recht intensiv nutzen.
Nein, Sie würden auch alle anderen anstehenden Jobs verlieren.
Der einfachste und sicherste Weg ist sv reload unicorn aus dem Container heraus.
[Zitat=“Richard - Communiteq, Beitrag:10, Thema: 352661, Benutzername: RGJ”]
Wir sehen dieses Problem nur bei einer kleinen Untergruppe aller unserer Server (ein paar Prozent), und es scheint die Instanzen zu betreffen, die den Narrative Bot recht intensiv nutzen.
[/Zitat]
Das ist bei unserem Forum nicht der Fall. KI ist nur für das Personal sichtbar, und ich habe bestätigt, dass kein Personal sie benutzt.
Interessanter Fund, danke, dass Sie sich damit beschäftigt haben.
Es ist schwer zu sagen, wann ein solches intermittierendes Problem verschwindet. Ich habe diese Zeile in den drei Instanzen entfernt, die am häufigsten hingen (eine davon fast täglich). Ich werde hier entweder wieder nachsehen:
wenn eine dieser Instanzen hängt (dann wissen wir, dass dies nicht geholfen hat)
am Freitag, wenn keine von ihnen gehangen hat (dann können wir annehmen, dass es die Lösung war)
[quote=„Richard – Communiteq, Beitrag:16, Thema:352661, Benutzername:RGJ“]
Es ist schwer zu sagen, wann ein solches intermittierendes Problem verschwindet. Ich habe diese Zeile bei den drei Instanzen entfernt, die am häufigsten hingen (eine davon fast täglich). Ich werde hier wieder nachsehen:\n\n* wenn eine dieser Instanzen hängt (dann wissen wir, dass dies nicht geholfen hat)\n* am Freitag, wenn keine davon gehangen hat (dann können wir davon ausgehen, dass es die Lösung war)\n[/quote]\n\nObwohl die Probleme diese Woche aufgetreten sind, traten sie bei den drei Instanzen, bei denen wir diese require-Zeile entfernt haben, nicht auf. Ich denke also, wir können sicher davon ausgehen, dass dies der Schuldige ist . Vielen Dank, dass Sie das bemerkt haben, @tgxworld, das hätte ich niemals gefunden.\n\nWären Sie in der Lage, diesen Fix zurück in die stabile Version zu portieren?