No hemos visto estos problemas en nuestro hosting, ni en el de ningún otro auto-hoster, por lo que es probable que sea un problema específico de tu servidor. No tenemos ninguna solución relevante en preparación.
Por los síntomas, parece que Sidekiq (el procesador de trabajos en segundo plano) no está funcionando correctamente.
¿Ves algún error reciente al visitar /logs en tu foro?
¿Cómo se ve /sidekiq? ¿Muestra trabajos siendo procesados?
En un estado saludable, el número ‘enqueued’ (en cola) debería estar cerca de cero. Sospecho que si las cosas se han atascado, tu número será muy alto y puede que tarde un tiempo en procesarse hasta llegar a 0.
Sidekiq se estaba ejecutando (aparentemente felizmente), pero parecía estar atascado desde la actualización a la versión 3.4 con alrededor de 1000 trabajos en cola. Dado que las actualizaciones a menudo realizan rebakes o tareas asíncronas, no lo vimos como algo sospechoso.
Un reinicio del proceso solucionó el problema. Sospecho que el plugin “who’s online” podría ser el culpable, pero no estoy 100% seguro.
Probablemente no esté relacionado, pero también nos topamos con algo que podría ser que Sidekiq se esté portando mal después de una actualización reciente.
Además,
Coincidencia o no, uno de nuestros administradores vio esto en las últimas 24 horas, pero aún no he podido reproducirlo, por lo que podría haber sido un fallo puntual.
El panel de sidekiq no mostraba nada activo, las cinco ranuras de trabajos estaban llenas de trabajos de 21 horas, por lo que sidekiq no estaba extrayendo ningún trabajo nuevo de ningún tipo, y el recuento en cola estaba creciendo. De todos modos, necesitaba aplicar actualizaciones del sistema, así que reinicié el sistema, lo que solucionó el problema.
La cola de “quién está en línea” creciendo fue mi primera pista.
Visitar el panel de sidekiq no “le dio un empujón”.
Además, noté esta advertencia en el panel de Discourse:
Me pregunto si eso significaba que había una advertencia que simplemente no se mostraba en la interfaz de usuario en algún lugar. No noté esa advertencia inmediatamente después de mi última actualización, a 176ee0bf60. No reviso el panel con la frecuencia suficiente para saber cuándo habría aparecido.