Desactivamos el plugin durante aproximadamente 24 horas y luego lo volvimos a activar durante 24 horas.
A continuación, pego las notas de nuestro otro administrador.
El plugin está provocando que los trabajos programados se ralenticen.
Cuantos más trabajos hay en la cola, más le cuesta a la CPU mantenerse al día.
Así que lo que sucede es que el servidor ve mucho tráfico, pero las cosas parecen normales durante un tiempo hasta que los trabajos comienzan a acumularse.
Finalmente, la CPU tiene dificultades para mantenerse al día y el uso aumenta y disminuye a medida que completa los trabajos atrasados.
Por eso vimos antes que había más de 3000 trabajos atrasados.
En circunstancias normales, nunca hay más de 5 trabajos. Pero casi siempre hay 0 porque no debería haber trabajos atrasados, deberían procesarse de inmediato.
La imagen adjunta muestra los trabajos actuales que se están acumulando. Ahora mismo, se mantiene entre 30 y 35 trabajos atrasados.
Todos los trabajos son nuevos desde la última publicación en el sidecar.
Aún no puedo decir por qué, pero esto solo sucede cuando el plugin está activado.
Última hora de los recursos en la CPU
Últimas 24 horas, señalando aproximadamente dónde se activó el plugin (ver la tendencia ascendente después del pico)
Parece que el patrón es más largo de 24 horas para notarlo, pero el plugin causa un uso general de recursos del 80-90+% la mayor parte del tiempo.
Una vez que lo desactivemos, notaremos que durante las próximas 24 horas el servidor promediará entre el 60 y el 75% y los trabajos no se acumularán.
Además, cuando queramos, cambié el app.yml para tener 16 workers de unicorn. Cuando queramos reconstruir, creo que deberíamos deshabilitar el plugin y tener 16 workers de unicorn. Observaremos el rendimiento del servidor durante ese período de tiempo y ajustaremos el valor de los workers a lo que creamos que es mejor.
Últimos 7 días
rojo = activado
azul = desactivado
Después de volver a activar el plugin, la CPU está experimentando picos. Tengo menos confianza en que la parte de los trabajos sea importante. Noté que el recuento de trabajos aumenta con más workers de unicorn. Creo que el número no está relacionado.
Todavía veo el problema de que el plugin retiene recursos.
Todavía no estoy 100% seguro, pero confío mucho en que el plugin es un problema.
plugin + 16 workers: bloquea el servidor
16 workers sin plugin - funciona bien
plugin + 8 workers - lento pero funciona
gráfico después de desactivar el plugin