Einige Kontextinformationen: Emails have stopped sending - end of file reached
Vor etwa einer Woche (13. Januar 2021) begannen E-Mails, die über den SMTP-Relay-Server von Google (smtp-relay.gmail.com) gesendet werden sollten, zu versagen (dies ist eine zulässige und beabsichtigte Nutzung für Google Apps-Benutzer).
Sidekiq meldete die Fehler mit EOFErrors:
Jobs::HandledExceptionWrapper: Wrapped EOFError: end of file reached
Und /logs meldete ebenfalls die fehlgeschlagenen Aufgaben:
Job exception: end of file reached
Der Backtrace ist im anderen Beitrag verfügbar.
===================
Die Untersuchung ergab, dass Discourse-Installationen mit dem aktuellen Stand SMTP-Relays mit ‘EHLO localhost’ verbinden – und Google hat dies vor etwa einer Woche abgelehnt.
Aus tcpdump auf einer Produktionsinstanz:
0x0030: d10f f8e4 4548 4c4f 206c 6f63 616c 686f ....EHLO.localho
0x0040: 7374 0d0a st..
...
0x0030: de62 f0c3 3432 3120 342e 372e 3020 5472 .b..421.4.7.0.Tr
0x0040: 7920 6167 6169 6e20 6c61 7465 722c 2063 y.again.later,.c
0x0050: 6c6f 7369 6e67 2063 6f6e 6e65 6374 696f losing.connectio
0x0060: 6e2e 2028 4548 4c4f 2920 6a31 3673 6d34 n..(EHLO).j16sm4
0x0070: 3831 3932 3976 736d 2e31 202d 2067 736d 81929vsm.1.-.gsm
0x0080: 7470 0d0a tp..
Und eine Nachbildung mit telnet ergibt das gleiche Ergebnis:
root@conversation:~# telnet smtp-relay.gmail.com 587
Trying 74.125.137.28...
Connected to smtp-relay.gmail.com.
Escape character is '^]'.
220 smtp-relay.gmail.com ESMTP ls8sm507258pjb.6 - gsmtp
ehlo localhost.localdomain
421 4.7.0 Try again later, closing connection. (EHLO) ls8sm507258pjb.6 - gsmtp
Connection closed by foreign host.
Ein domainspezifisches EHLO funktioniert jedoch ordnungsgemäß:
root@conversation:~# telnet smtp-relay.gmail.com 587
Trying 74.125.137.28...
Connected to smtp-relay.gmail.com.
Escape character is '^]'.
220 smtp-relay.gmail.com ESMTP p10sm668563uaw.3 - gsmtp
ehlo conversation.sevarg.net
250-smtp-relay.gmail.com at your service, [64.227.96.27]
250-SIZE 157286400
250-8BITMIME
250-STARTTLS
250-ENHANCEDSTATUSCODES
250-PIPELINING
250-CHUNKING
250 SMTPUTF8
======
Basierend auf den Logs habe ich die Datei identifiziert, die zur Prüfung der Korrektur geändert werden muss (im Docker-Image):
/var/www/discourse/vendor/bundle/ruby/2.7.0/gems/mail-2.7.1/lib/mail/network/delivery_methods/smtp.rb
Ändern von
DEFAULTS = {
:address => 'localhost',
:port => 25,
:domain => 'localhost.localdomain',
in
DEFAULTS = {
:address => 'conversation.sevarg.net',
:port => 25,
:domain => 'conversation.sevarg.net',
hat das Problem behoben (nach einem Neustart der Instanz). Der EHLO-Befehl wird nun mit dem Domänenstring gesendet, und E-Mails werden von meiner Instanz ordnungsgemäß versendet.
================
Gewünschtes Verhalten: Beim Versenden von E-Mails verwendet die Standard-Discourse-Installation den konfigurierten Domänennamen für die initiale Verbindung zum SMTP-Server. Alternativ gibt es eine Konfigurationsoption, um die gesendete Domäne zu überschreiben. Falls diese existiert, konnte ich sie durch Suchen nicht finden.