Lorsque nous examinons le nombre de vues de page de notre crawler, il semble y avoir une entrée non identifiée qui cumule plus de 500 000 vues de page en un mois :
Nous sommes un projet FLOSS auto-hébergé, donc je suppose que cela est hors de question
Je sais que je pourrais ajouter plus de filtres et demander à notre responsable de l’infrastructure d’examiner davantage les journaux – je me demandais simplement si quelqu’un d’autre avait déjà rencontré ce problème.
Je viens de rencontrer notre principal administrateur système en personne et j’ai trouvé la solution. C’est HAProxy qui effectue une vérification de santé toutes les 5 secondes
Les vérifications de santé doivent définir un User Agent approprié afin que cela ne se reproduise plus. Vous pouvez également utiliser la route /srv/status pour les vérifications de santé.