Nell’ultima settimana abbiamo visto tre istanze di Sidekiq su forum diversi bloccarsi. Non stava succedendo nulla di particolare, semplicemente Sidekiq non stava elaborando alcun lavoro e mostrava 5 processi su 5.
Una cosa interessante che avevano tutte in comune era la presenza di un job critico BotInput tra i job in coda. Ora questo è un job abbastanza comune, ma comunque si distingue.
Dopo aver riavviato Sidekiq, tutto torna a funzionare normalmente. Mettere in coda manualmente un job con gli stessi parametri non causa più il blocco. Non c’è nulla di particolare nel post specifico per cui è stato chiamato.
Qualcuno ha qualche idea su come potremmo rintracciare cosa sta succedendo qui?
Ho avuto problemi con Sidekiq da quando è stato eseguito l’aggiornamento del forum un mese fa. Quale comando usi per riavviare Sidekiq? Solo un sv restart sidekiq?
Sto riscontrando questo problema negli ultimi giorni. Alla fine tutti i processi smettono di funzionare. In precedenza ho riavviato, ma è sicuro eliminare la coda critica? È una coda redis?
Sono aggiornato alla versione 3.5.0.beta1-dev.
Solo un’ipotesi, ma a volte quando sto chattando con il bot, questo smette di rispondere, quindi aggiorno la pagina o rinuncio. Forse quei casi lasciano un processo in sospeso?
Questi lavori sono asincroni, quindi non saprebbero nemmeno che l’hai fatto.
È interessante sentire che stai riscontrando questo problema anche su Jobs::BotInput. Stiamo riscontrando questo problema solo su un piccolo sottoinsieme di tutti i nostri server (pochi percento) e sembra che siano le istanze che utilizzano il bot narrativo in modo piuttosto intensivo.
No, perderesti anche tutti gli altri lavori in coda.
Il modo più semplice e sicuro è sv reload unicorn dall’interno del container.
Interessante scoperta, grazie per aver indagato.
È difficile dire quando un problema così intermittente scompare. Ho rimosso quella riga nelle tre istanze che si bloccavano più spesso (una di esse quasi quotidianamente). Tornerò qui:
quando una di quelle istanze si bloccherà (sapremo allora che non ha funzionato)
venerdì se nessuna di esse si è bloccata (potremo allora iniziare a presumere che sia stata la soluzione)
[quote=“Richard - Communiteq, post:16, topic:352661, username:RGJ”]
È difficile dire quando un problema così intermittente scompare. Ho rimosso quella riga nelle tre istanze che si bloccavano più spesso (una di esse quasi quotidianamente). Tornerò qui:\n\n* quando una di quelle istanze si blocca (allora sapremo che non ha funzionato)\n* venerdì se nessuna di esse si è bloccata (allora potremo iniziare a presumere che sia stata la soluzione)\n[/quote]
Mentre i problemi si sono verificati questa settimana, non si sono verificati nelle tre istanze in cui abbiamo rimosso quella riga require, quindi penso che possiamo tranquillamente presumere che questo sia il colpevole . Grazie per averlo notato @tgxworld , non l’avrei mai trovato.\n\nRiusciresti a eseguire il backport di quella correzione alla versione stabile?