He visto un aumento sustancial en el uso de la CPU desde la actualización de este fin de semana. El uso de la CPU de RUBY parece ser el principal impulsor. Otro usuario de Discourse hizo referencia a esto en este tema.
Como puede ver en los gráficos a continuación, el uso de CPU y la carga antes de la actualización fueron mucho menores que después de la actualización. La actualización ocurrió la noche del 31/1.
En 33 horas, hay un uso significativo de CPU de Ruby. Según los datos de TOP, he visto un uso de CPU 2 veces mayor en las últimas 33 horas durante 22 días. En 33 horas, he visto 11 horas de tiempo de CPU. (648 minutos de tiempo de CPU en 5 PID)
Datos adicionales:
El tráfico ha disminuido en los últimos dos días en aproximadamente un 10%. (analíticas y panel)
Instalación estándar de Discourse en un solo contenedor (sin chat)
Las colas de Sidekiq son mínimas (1K a 2K por día)
No parece haber nada inusual en los registros de Discourse
Funciono en un servidor de DO con 8 GB de RAM y 2 vCPU AMD.
Este no es el caso en el que el servidor está crítico, pero los servidores que funcionan al 5% al 7% son mucho más felices que los que funcionan al 25%.
¿Qué información puedo proporcionar para ayudar a solucionar este problema?
Dejemos esto en soporte por un tiempo hasta que determinemos si hay un error.
¿Puedes entrar en el contenedor y ejecutar un htop desde el interior (tendrás que instalarlo) de esa manera podrás decir qué proceso específico está consumiendo grandes cantidades de CPU?
Lo más probable, sin embargo, es que sidekiq /sidekiq esté sobrecargado de alguna manera en tu instancia. (Me fijaría particularmente en el planificador)
Sí, resolvió el problema de alta CPU. Mi carga de 1 y 5 minutos es aproximadamente 1/3 de los valores anteriores. Eso es con htop y netdata ahora ejecutándose en el sistema.