Strategie per identificare e classificare errori critici di posta elettronica / altri?

Abbiamo recentemente riscontrato un problema su Discourse in cui le email in arrivo non venivano ricevute a causa di (probabilmente) un problema di autenticazione con il nostro servizio di posta elettronica. Sfortunatamente, questo è andato avanti per un periodo prolungato (forse settimane?) senza che nessuno se ne accorgesse, poiché gli utenti che pubblicano e rispondono ai post del forum via email generalmente non sono sul forum per VEDERE se le loro email vengono effettivamente pubblicate (e, nel nostro caso, le email in uscita funzionavano ancora bene). Effettivamente, avevamo un gruppo di utenti che erano totalmente messi a tacere senza che nessuno se ne accorgesse: questo è molto, molto grave. :slight_smile:

Il meta-problema qui è: ho scoperto il problema solo perché un utente ha notato che un suo post mancava, e ho scavato nei log per 30 minuti finché non ho trovato il colpevole: il tempo di risposta qui ovviamente non è accettabile. Esiste un meccanismo di cui non sono a conoscenza che avrebbe segnalato immediatamente questo problema agli amministratori? Mi aspetterei che i fallimenti ripetuti a un servizio fondamentale come la posta elettronica (specialmente fallimenti non temporanei come un fallimento di autenticazione…) sollevassero una bandiera visibile DA QUALCHE PARTE in modo che potesse essere indagata? Ci sono altre buone strategie per tenere d’occhio questi tipi di problemi?

1 Mi Piace

Quindi, se stavi usando POP3 e Discourse non è riuscito a connettersi al tuo server POP3, sarebbe apparsa una notifica nella dashboard di amministrazione.

Se non stavi usando POP3, descrivi come stai inviando le email e quale tipo di problema di autenticazione sospetti.

1 Mi Piace