Recentemente encontramos um problema no nosso Discourse onde e-mails de entrada não estavam sendo recebidos devido a (provavelmente) um problema de autenticação com nosso serviço de e-mail. Infelizmente, isso ocorreu por um período prolongado (possivelmente semanas?) sem o conhecimento de ninguém, já que os usuários que postam e respondem a tópicos do fórum por e-mail geralmente não estão no fórum para VER se seus e-mails estão sendo realmente postados (e, no nosso caso, os e-mails de saída ainda funcionavam bem). Efetivamente, tivemos um grupo de usuários que foram totalmente silenciados sem que ninguém notasse - isso é muito, muito ruim. ![]()
O meta-problema aqui é: descobri o problema porque um usuário, por acaso, notou que uma postagem dele estava faltando, e eu vasculhei os logs por 30 minutos até encontrar o culpado - o tempo de resposta aqui obviamente não é aceitável. Existe algum mecanismo que eu não conheça que teria sinalizado esse problema imediatamente para os administradores? Eu esperaria que falhas repetidas em um serviço principal como o e-mail (especialmente falhas não temporárias como uma falha de autenticação…) levantassem uma bandeira visível EM ALGUM LUGAR para que pudesse ser investigada? Existem outras boas estratégias para acompanhar esses tipos de problemas?