Недавно мы столкнулись с проблемой на нашем Discourse: входящие письма не поступали, вероятно, из-за ошибки аутентификации у нашего почтового сервиса. К сожалению, это продолжалось длительное время (возможно, недели), и никто об этом не знал, поскольку пользователи, публикующие и отвечающие на сообщения форума через email, обычно не заходят на сам форум, чтобы УВИДЕТЬ, действительно ли их письма опубликованы (и, в нашем случае, исходящие письма всё ещё работали нормально). По сути, у нас оказалась группа пользователей, которые были полностью заглушены, и никто этого не заметил — это очень и очень плохо. ![]()
Возникает более общая проблема: я обнаружил неполадку только потому, что один пользователь заметил отсутствие своего сообщения, и я потратил 30 минут на просмотр логов, пока не нашёл виновника — такой временной промежуток явно неприемлем. Не существует ли механизма, о котором я не знаю, который мог бы немедленно предупредить администраторов об этой проблеме? Я бы ожидал, что повторяющиеся сбои в работе такого ключевого сервиса, как почта (особенно не временные, как ошибка аутентификации…), вызовут видимый сигнал ГДЕ-ТО, чтобы можно было провести расследование. Есть ли другие эффективные стратегии для отслеживания подобных проблем?