Nous avons récemment rencontré un problème sur notre Discourse où les e-mails entrants n’étaient pas reçus en raison (probablement) d’un problème d’authentification avec notre service de messagerie. Malheureusement, cela a duré une période prolongée (peut-être des semaines ?) sans que personne ne s’en aperçoive, car les utilisateurs qui publient et répondent aux messages du forum par e-mail ne sont généralement pas sur le forum pour VOIR si leurs e-mails sont effectivement publiés (et, dans notre cas, les e-mails sortants fonctionnaient toujours correctement). Efficacement, nous avions un groupe d’utilisateurs qui étaient totalement réduits au silence sans que personne ne s’en aperçoive - c’est très très mauvais. ![]()
Le méta-problème ici est : j’ai découvert le problème parce qu’un utilisateur a remarqué qu’un de ses messages était manquant, et j’ai fouillé dans les journaux pendant 30 minutes jusqu’à ce que je trouve le coupable - le temps de réaction ici n’est évidemment pas acceptable. Existe-t-il un mécanisme dont je ne suis pas au courant qui aurait signalé ce problème immédiatement aux administrateurs ? Je m’attendrais à ce que des échecs répétés d’un service essentiel comme la messagerie (surtout des échecs non temporaires comme un échec d’authentification…) soulèvent un drapeau visible QUELQUE PART afin qu’il puisse être étudié ? Existe-t-il d’autres bonnes stratégies pour garder un œil sur ce genre de problèmes ?