Strategien zur Identifizierung und Priorisierung von E-Mail-/anderen kritischen Fehlern?

Wir sind kürzlich auf ein Problem auf unserem Discourse gestoßen, bei dem eingehende E-Mails aufgrund eines (wahrscheinlich) Authentifizierungsproblems mit unserem E-Mail-Dienst nicht empfangen wurden. Leider dauerte dies über einen längeren Zeitraum (möglicherweise Wochen?) an, ohne dass es jemand bemerkte, da die Benutzer, die über E-Mail Beiträge im Forum erstellen und beantworten, im Allgemeinen nicht im Forum sind, um ZU SEHEN, ob ihre E-Mails tatsächlich gepostet werden (und in unserem Fall funktionierten ausgehende E-Mails weiterhin einwandfrei). Im Wesentlichen hatten wir eine Gruppe von Benutzern, die völlig zum Schweigen gebracht wurden, ohne dass es jemand bemerkte – das ist sehr, sehr schlecht. :slight_smile:

Das Meta-Problem hier ist: Ich habe das Problem nur entdeckt, weil ein Benutzer zufällig bemerkte, dass ein Beitrag von ihm fehlte, und ich 30 Minuten lang die Protokolle durchsuchte, bis ich den Schuldigen fand – die Bearbeitungszeit ist hier offensichtlich nicht akzeptabel. Gibt es einen Mechanismus, den ich nicht kenne, der dieses Problem sofort für Administratoren gemeldet hätte? Ich würde erwarten, dass wiederholte Fehler bei einem Kerndienst wie E-Mail (insbesondere nicht-temporäre Fehler wie ein Authentifizierungsfehler…) irgendwo ein sichtbares Flag auslösen, damit es untersucht werden könnte? Gibt es andere gute Strategien, um diese Art von Problemen im Auge zu behalten?

1 „Gefällt mir“

Wenn Sie POP3 verwendet haben und Discourse keine Verbindung zu Ihrem POP3-Server herstellen konnte, wäre im Admin-Dashboard eine Warnung angezeigt worden.

Wenn Sie kein POP3 verwendet haben, beschreiben Sie bitte, wie Sie E-Mails versenden und welche Art von Authentifizierungsproblem Sie vermuten.

1 „Gefällt mir“