Desativamos o plugin por cerca de 24 horas, depois o reativamos por 24 horas.
Abaixo estou colando anotações do nosso outro administrador.
O plugin está causando lentidão no agendamento de trabalhos.
Quanto mais trabalhos na fila, mais a CPU luta para acompanhar.
Então, o que acontece é que o servidor vê muito tráfego, mas as coisas parecem normais por um tempo até que os trabalhos comecem a se acumular.
Eventualmente, a CPU luta para acompanhar e o uso aumenta e diminui à medida que conclui os trabalhos em atraso.
É por isso que vimos anteriormente que havia mais de 3000 trabalhos em atraso.
Em circunstâncias normais, nunca há mais de 5 trabalhos. mas quase sempre há 0 porque nenhum trabalho deve ficar em atraso, eles devem ser processados imediatamente.
A imagem anexada mostra os trabalhos atuais ficando em atraso. No momento, está pairando em 30-35 trabalhos em atraso.
Todos os trabalhos são novos da última postagem no sidecar.
Ainda não consigo dizer o porquê, mas isso só acontece quando o plugin está ativado.
Última hora dos recursos na CPU
últimas 24 horas, apontando aproximadamente onde o plugin foi ativado (Veja a tendência de alta após o pico)
Parece que o padrão é mais longo que 24 horas para notar, mas o plugin causa uso geral de recursos na faixa de 80-90+% na maior parte do tempo.
Assim que o desativarmos, começaremos a notar que nas próximas 24 horas o servidor terá uma média de 60-75% e os trabalhos não ficarão em atraso.
Também quando quisermos, alterei o app.yml para ter 16 workers do unicorn. quando quisermos reconstruir, acho que devemos desativar o plugin e ter 16 workers do unicorn. Observamos o desempenho do servidor durante esse período e ajustamos o valor dos workers para o que acharmos melhor.
Nos últimos 7 dias
vermelho = ativado
azul = desativado
Após reativar o plugin, a CPU está com picos. Tenho menos confiança de que a parte dos trabalhos seja um grande problema. Notei que a contagem de trabalhos aumenta com mais workers do unicorn. Acho que o número não está relacionado.
Ainda vejo o problema sobre o plugin segurando recursos.
Ainda não tenho 100% de certeza, mas estou muito confiante de que o plugin é um problema.
plugin + 16 workers: trava o servidor
16 workers sem plugin - funcionando bem
plugin + 8 workers - lento, mas funciona
gráfico após desativar o plugin