Stratégies pour identifier et trier les erreurs critiques par e-mail / autres?

Nous avons récemment rencontré un problème sur notre Discourse où les e-mails entrants n’étaient pas reçus en raison (probablement) d’un problème d’authentification avec notre service de messagerie. Malheureusement, cela a duré une période prolongée (peut-être des semaines ?) sans que personne ne s’en aperçoive, car les utilisateurs qui publient et répondent aux messages du forum par e-mail ne sont généralement pas sur le forum pour VOIR si leurs e-mails sont effectivement publiés (et, dans notre cas, les e-mails sortants fonctionnaient toujours correctement). Efficacement, nous avions un groupe d’utilisateurs qui étaient totalement réduits au silence sans que personne ne s’en aperçoive - c’est très très mauvais. :slight_smile:

Le méta-problème ici est : j’ai découvert le problème parce qu’un utilisateur a remarqué qu’un de ses messages était manquant, et j’ai fouillé dans les journaux pendant 30 minutes jusqu’à ce que je trouve le coupable - le temps de réaction ici n’est évidemment pas acceptable. Existe-t-il un mécanisme dont je ne suis pas au courant qui aurait signalé ce problème immédiatement aux administrateurs ? Je m’attendrais à ce que des échecs répétés d’un service essentiel comme la messagerie (surtout des échecs non temporaires comme un échec d’authentification…) soulèvent un drapeau visible QUELQUE PART afin qu’il puisse être étudié ? Existe-t-il d’autres bonnes stratégies pour garder un œil sur ce genre de problèmes ?

1 « J'aime »

Donc, si vous utilisiez POP3 et que Discourse ne parvenait pas à se connecter à votre serveur POP3, un avertissement s’afficherait dans le tableau de bord de l’administrateur.

Si vous n’utilisiez pas POP3, veuillez décrire comment vous envoyez les e-mails et quel type de problème d’authentification vous suspectez.

1 « J'aime »