J’héberge tous mes fichiers téléchargés sur un stockage NAS (glusterfs).
Récemment, j’ai constaté un trafic réseau énorme et constant sur le NAS. J’ai découvert que cela était dû à Discourse qui demandait des images optimisées. Existe-t-il une tâche qui recherche constamment ces images ? Pourquoi ? Et comment puis-je la désactiver ?
Possiblement le remplissage @david ajouté pour la recherche de la couleur d’image principale.
Il finira par se terminer et reviendra à un état stable.
Nous devons parcourir toutes les images pour le remplissage, vous pourrez peut-être contourner le problème en forçant la couleur de toutes les images à blanc ou autre chose.
Il traite 25 images par 15 minutes. oui ? cela devrait être très négligeable. Je vois des milliers de fichiers être recherchés chaque minute.
Et en regardant également la bande passante d’il y a 6 mois, je vois le même comportement. Je pense donc que cela devrait être autre chose.
Cependant, je suis à peu près sûr que c’est fait par un job discourse ou quelque chose de similaire, car lorsque j’arrête l’application discourse, la bande passante disparaît. Cependant, lorsque j’arrête juste l’application nginx de discourse, la bande passante reste.
Toute notre logique d’arrière-plan s’exécute sur des tâches Sidekiq. Si aucune tâche ne s’exécute et que vous avez toujours une activité disque élevée, cela pourrait-il être des utilisateurs visitant votre site Web et des images servies par nginx ?
Avez-vous un CDN de mise en cache devant vos ressources statiques ?
@Falco@sam Je pense avoir trouvé la cause première.
J’ai d’abord redémarré l’application Discourse pour que le trafic constant disparaisse. Ensuite, je suis allé dans le panneau d’administration et dans la section des rapports en masse. Cela fait longtemps que les rapports ne s’affichent pas correctement ici :
Immédiatement après que les rapports aient expiré, j’ai vu un pic de bande passante réseau. Et j’ai vu cette erreur dans les journaux d’erreurs :
'hijack admin/reports bulk ' est toujours en cours d'exécution après 90 secondes sur la base de données par défaut, ce processus peut nécessiter un redémarrage !
Je pense que le calcul de l’espace utilisé sur un dossier NAS contenant beaucoup de fichiers prendrait beaucoup de temps et serait la cause principale d’une bande passante élevée.
Je vois. Le résultat de ce rapport est mis en cache, mais je suppose qu’il ne se termine jamais et ne peut pas être mis en cache car votre partage réseau est trop lent.
Alors, y a-t-il quelque chose que nous puissions faire pour éviter cela ? Par exemple, le traiter comme des téléchargements s3 où nous ne calculons pas la taille du disque.