Alojo todos mis archivos de carga en un NAS de almacenamiento (glusterfs).
Recientemente descubrí que hay un tráfico de red enorme y constante en el NAS. Y lo rastreé hasta Discourse solicitando imágenes optimizadas. ¿Hay alguna tarea que busque constantemente estas imágenes? ¿Por qué? ¿Y cómo puedo desactivarla?
Está funcionando con 25 imágenes cada 15 minutos. ¿sí? esto debería ser muy insignificante. Estoy viendo miles de archivos siendo buscados cada minuto.
Y también mirando el ancho de banda de hace 6 meses, veo el mismo comportamiento. Así que creo que debería ser algo más.
Sin embargo, estoy bastante seguro de que lo está haciendo un trabajo de discourse o algo similar, porque cuando detengo la aplicación de discourse, el ancho de banda desaparece. Sin embargo, cuando solo detengo la aplicación nginx de discourse, el ancho de banda permanece.
Toda nuestra lógica de fondo se ejecuta en trabajos de Sidekiq. Si no se está ejecutando ningún trabajo y aún tiene un alto I/O de disco, ¿podrían ser los usuarios que visitan su sitio web y las imágenes que son servidas por nginx?
¿Tiene una CDN de caché delante de los activos estáticos?
Primero reinicié la aplicación de discurso para que el tráfico constante desapareciera. Luego fui al panel de administración y fui a la sección de informes masivos. Ha pasado mucho tiempo desde que los informes no se muestran correctamente aquí:
Inmediatamente después de que los informes fallan, veo el salto en el ancho de banda de la red. Y veo este error en los registros de errores:
'hijack admin/reports bulk ' todavía se está ejecutando después de 90 segundos en la base de datos predeterminada, ¡este proceso puede necesitar ser reiniciado!
Creo que calcular el espacio utilizado en una carpeta NAS con muchos archivos consumiría mucho tiempo y sería la causa principal de un alto ancho de banda.
Ya veo. El resultado de ese informe está en caché, pero supongo que nunca termina y no se puede almacenar en caché porque su recurso compartido de red es demasiado lento.