Abbiamo disattivato il plugin per circa 24 ore, quindi lo abbiamo riattivato per 24 ore.
Di seguito incollo le note del nostro altro amministratore.
Il plugin sta causando un rallentamento nell’esecuzione dei processi pianificati.
Più processi ci sono in coda, più la CPU fatica a tenere il passo.
Quindi, ciò che accade è che il server vede molto traffico, ma le cose sembrano normali per un po’ finché i processi non iniziano ad accumularsi.
Alla fine, la CPU fatica a tenere il passo e l’utilizzo aumenta e diminuisce man mano che completa i processi arretrati.
Ecco perché in precedenza abbiamo visto oltre 3000 processi in arretrato.
In circostanze normali, non ci sono mai più di 5 processi. ma quasi sempre ce ne sono 0 perché nessun processo dovrebbe essere in arretrato, dovrebbero essere elaborati immediatamente.
L’immagine allegata mostra i processi correnti che si stanno accumulando. Al momento si aggira intorno ai 30-35 processi in arretrato.
Tutti i processi sono nuovi dall’ultimo post nel sidecar.
Non riesco ancora a capire perché, ma questo accade solo quando il plugin è attivo.
Ultima ora delle risorse sulla CPU
ultime 24 ore, indicando approssimativamente dove il plugin è stato abilitato (Vedi l’andamento verso l’alto dopo il picco)
Sembra che il pattern sia più lungo di 24 ore per essere notato, ma il plugin causa un utilizzo generale delle risorse nell’80-90+% per la maggior parte del tempo.
Una volta che lo disattiveremo, noteremo che nelle successive 24 ore il server avrà una media del 60-75% e i processi non si accumuleranno.
Inoltre, quando lo vorremo, ho modificato app.yml per avere 16 worker unicorn. quando vorremo ricostruire, penso che dovremmo disabilitare il plugin e avere 16 worker unicorn. Osserveremo le prestazioni del server durante quel periodo e adegueremo il valore dei worker a ciò che riteniamo sia meglio.
Negli ultimi 7 giorni
rosso = abilitato
blu = disabilitato
Dopo aver riattivato il plugin, la CPU sta aumentando. Sono meno sicuro che i conteggi dei processi siano un problema importante. Ho notato che i conteggi dei processi aumentano con più worker unicorn. Penso che il numero non sia correlato.
Vedo ancora il problema del plugin che trattiene risorse.
Non sono ancora sicuro al 100%, ma sono molto fiducioso che il plugin sia un problema.
plugin + 16 worker: blocca il server
16 worker senza plugin - funziona bene
plugin + 8 worker - lento ma funziona
grafico dopo aver disattivato il plugin