Fehlende Leerzeichen im Aktivitätszusammenfassung-E-Mail-Text

Ich habe mir gerade einige Vorschauzusammenfassungen gesendet, da ich sie normalerweise nicht erhalte.

Ich sehe einige zufällige – aber konsistente – fehlende Leerzeichen in Überschriften und Text innerhalb der E-Mail. Diese Leerzeichen fehlen nicht im Forum-Inhalt, aber dieselben werden in mehreren generierten Vorschauzusammenfassungen konsistent weggelassen, wie in verschiedenen E-Mail-Clients zu sehen ist.

Ich habe versucht, die ursprünglichen Leerzeichen zu löschen und erneut hinzuzufügen, ohne Erfolg.

Auszüge:

Ich habe die Zusammenfassungen, die ich von einigen anderen Discourse-Foren erhalte, überprüft und sehe dies nirgendwo anders.

Haben andere dies gesehen oder eine Idee, was passiert?

Könnte dies ein Schriftart-/Anzeigeproblem sein? Haben Sie den zugrunde liegenden Rohinhalt überprüft?

Hm. Ich bin mir nicht sicher, wie ich ein Schriftart-/Anzeigeproblem diagnostizieren kann. Die E-Mails werden in mehreren Mailclients und Browsern unter Windows und Linux gleich dargestellt.

Ich habe .json an die URLs der Forenbeiträge angehängt, und es gibt nichts Ungewöhnliches am „topic_slug“ oder am „cooked“-Inhalt…

Gibt es noch etwas, das ich im Rohinhalt überprüfen könnte?

1 „Gefällt mir“

Sie müssen die rohe E-Mail überprüfen und nicht den Beitrag.

1 „Gefällt mir“

Ok – ich habe mir die Rohfassung der E-Mail angesehen, und wo in der HTML-Version Leerzeichen fehlen, hat die Textversion die korrekten Leerzeichen. Allerdings fehlen in der Textversion andere Leerzeichen. Es gibt keinen Zusammenhang.

Vielleicht könnte es ein Fehler bei der Zeichenkodierung im Zuge des Kopierens/Einfügens der betroffenen Themen von einer Legacy-Plattform sein..? EDIT: Nein. Es setzt sich mit aktuellen Beiträgen fort und auch mit anderen E-Mails – nicht nur mit der Zusammenfassung.

Neuere Discourse-Zusammenfassungen mit aktuellen Beiträgen weisen nicht dasselbe Problem auf, daher mache ich mir keine großen Sorgen, es sei denn, ich sehe, dass es weitergeht. EDIT: Es geht weiter.

(Nebenbemerkung: Nur um diese Dinge im Auge zu behalten, wünschte ich mir jetzt, ich könnte eine umfassende Zusammenfassung erzwingen, die täglich an mein Admin-Konto gesendet wird – unabhängig davon, ob ich ständig angemeldet bin.)

Könnten Sie mir eine dieser E-Mails als Anhang weiterleiten?

EDIT: erledigt

OK, hier ist, was ich im rohen E-Mail-Text sehe:

[Mis/Disinformation beginnt, die Zivilisation zu überwältigen][2]

Die dunkle Seite von generativer KI ist, dass sie die Produktion von Fehlinformationen (wegen Konfabulierung) und Desinformation (d. h. absichtliche Produktion von gefälschten Nachrichten zur Erreichung eines Ziels) im industriellen Maßstab ermöglicht. Das Rendern von Webseiten im Stil maßgeblicher Quellen ist unkompliziert, und Fortschritte bei Deep Fakes werden Videogeschichtenkomplemente erleichtern. Abgesehen von Vinges Wolken gefälschter Informationen zur Verbergung von Informationen (Rainbows End), von denen ich nicht glaube, dass sie eine Lösung darstellten, haben sich SF-Autoren darüber Gedanken gemacht und wie man damit umgehen könnte?

Anmerkung:

  • to overwhelm :white_check_mark:
  • a paperback :white_check_mark:
  • Renderingof :x:
  • Asidefrom :x:

und in der HTML-Version:


<a href="https://forum.tasat.org/t/mis-disinformation-starts-to-overwhelm-civilization/66" style="text-decoration: none; font-weight: bold; color: #006699;; font-weight:400;line-height:1.3;margin:0;padding:0;text-decoration:none">
<strong >Mis/Disinformation beginnt, die Zivilisation zu überwältigen</strong>
…
Das Rendern von Webseiten im Stil maßgeblicher Quellen ist unkompliziert, und Fortschritte bei Deep Fakes werden Videogeschichtenkomplemente erleichtern. Abgesehen von

Anmerkung:

  • tooverwhelm :x:
  • apaperback :x:
  • Rendering of :white_check_mark:
  • Aside from :white_check_mark:

In der rohesten (d. h. kodierten) Form sind diese Fehler immer noch vorhanden:

[Mis/Disinformation beginnt, die Zivilisation zu überwältigen][2]

Die dunkle Seite von generativer KI ist, dass sie die Produktion von Fehlinformationen (=
wegen Konfabulierung) und Desinformation (d. h. absichtliche Produktion von gefälschten=
Nachrichten zur Erreichung eines Ziels) im industriellen Maßstab ermöglicht. Das Rendern=
von Webseiten im Stil maßgeblicher Quellen ist unkompliziert, und Fortschritte bei Deep F=
akes werden Videogeschichtenkomplemente erleichtern. Abgesehen von Vinge=E2=80=99s C=
louds gefälschter Informationen zur Verbergung von Informationen (Rainbows End), von denen =
ich nicht glaube, dass sie eine Lösung darstellten, haben sich SF-Autoren darüber Ged=
anken gemacht und wie man damit umgehen könnte?
Ken

<a href=3D"https://foru=
m.tasat.org/t/mis-disinformation-starts-to-overwhelm-civilization/66" style=
=3D"text-decoration: none; font-weight: bold; color: #006699;; font-weight:=
400;line-height:1.3;margin:0;padding:0;text-decoration:none"&gt;
=
                         <strong >Mis/Disinformation beginnt, die Zivilisation zu überwältigen</strong>

Diese sind nicht im rohen/gekochten Zustand vorhanden:

000000d0: 5265 6e64 6572 696e 6720 6f66 2077 6562  Rendering of web
000000e0: 2070 6167 6573 2069 6e20 7468 6520 7374   pages in the st
000000f0: 796c 6520 6f66 2061 7574 686f 7269 7461  yle of authorita
000000100: 7469 7665 2073 6f75 7263 6573 2069 7320  tive sources is
000000110: 7374 7261 6967 6866 6f72 7761 7264 2c20  straighforward,
000000120: 616e 6420 7072 6f67 7265 7373 2069 6e20  and progress in
000000130: 6465 6570 2066 616b 6573 2077 696c 6c20  deep fakes will
000000140: 6d61 6b65 2076 6964 656f 2073 746f 7279  make video story
000000150: 2063 6f6d 706c 656d 656e 7473 2065 6173   complements eas
000000160: 6965 722e 2020 4173 6964 6520 6672 6f6d  ier.  Aside from

Nicht, dass ich dir nicht geglaubt hätte :smiley:

Also… Leerzeichen werden gelegentlich aus dem E-Mail-Body entfernt, sei es aus dem Textteil oder dem HTML-Teil. Und nicht an denselben Stellen!

Ich vermute, dass diese Fehler an einer von vier Stellen eingeführt worden sein könnten:

  • in Discourse, beim Generieren der E-Mail
  • beim Übertragen der E-Mail an den E-Mail-Einreichungsserver
  • beim Übertragen der E-Mail an einen Zwischen-/Endserver
  • bei der Zustellung an das Benutzerpostfach

Es ist wahrscheinlich am einfachsten, am Anfang zu beginnen.

Können Sie Discourse veranlassen, E-Mails an einen lokalen MTA zu senden, wo Sie sie in der Warteschlange inspizieren können, bevor der MTA sie an Ihren “tatsächlichen” E-Mail-Zustellungsserver sendet?

Danke für die Analyse, Michael!

Ich bin kein fortgeschrittener E-Mail-Administrator – ich betreibe die typische empfohlene Selbstinstallation mit tatsächlichem ausgehendem E-Mail-Verkehr über MailerSend.net und habe DKIM/DMARC usw. sorgfältig zu einem funktionierenden Zustand konfiguriert. Soweit ich das verstehe, ist die Einbindung eines lokalen MTA wie sendmail oder Postfix ein fortgeschrittener Schritt, der in den meisten Fällen abgeraten wird… Ich bin etwas besorgt, etwas zu vermasseln und möglicherweise eine funktionierende Pipeline zu stören. :grimacing:

Gibt es eine leicht rückgängig zu machende Implementierung eines MTA für die Fehlerbehebung, die ich in Betracht ziehen könnte?

Wie bereits in den Bearbeitungen oben erwähnt, besteht dieses Problem bei aktuellen benutzergenerierten Inhalten fort, nicht nur bei Inhalten, die von Administratoren kopiert und eingefügt wurden – und es wird jetzt bei E-Mails mit Zusammenfassungen, Antworten von Benutzern und Beiträgen von Benutzern beobachtet.

Der Support von MailerSend hat bestätigt, dass die Leerzeichen fehlen, wenn sie die Anfrage von Discourse erhalten – es scheint also, dass der Fehler bei der Generierung der E-Mail durch Discourse liegt…?

Interessanterweise fehlen Leerzeichen bei der Vorschau einer generierten Zusammenfassung – nur wenn sie als E-Mails empfangen werden.


Gleichzeitig habe ich dieses Problem mit Zusammenfassungs-E-Mails, das von anderen seit Februar gemeldet wird:

Diese wiederholten Beiträge sind in den generierten Zusammenfassungsvorschauen vorhanden.

EDIT 2024-04-26: Das Problem mit den wiederholten Zusammenfassungen wurde identifiziert. Bis zur Behebung habe ich das Problem durch Einstellungen geändert, aber es scheint keinen Zusammenhang mit diesem Thema zu haben. Ausgehende E-Mails weisen immer noch fehlende Leerzeichen auf.


Ich habe ein Befehlszeilen-Update und einen Neuaufbau durchgeführt, um zu sehen, ob dies eventuelle Probleme beheben würde, aber es hatte keine Auswirkung.

Wenn diese Dinge nicht bei jedem auftreten, der auf dem aktuellen Stand des Tests-bestanden-Branches ist, was könnte ich in meiner Einrichtung untersuchen?

Wenn Sie TLS zwischen Ihrem Server und Mailersend vorübergehend deaktivieren können, können Sie den tatsächlichen Datenverkehr untersuchen und sehen, ob Discourse die Leerzeichen sendet oder nicht. Damit wird diese Frage ein für alle Mal geklärt.

Wenn Sie dies nicht können, könnten Sie versuchen, den Datenverkehr mit MITM zu untersuchen, aber das ist komplizierter.

Wenn keine der oben genannten Methoden funktioniert, würde ich in diesem Fall ein lokales Postfix konfigurieren, aber nicht für die direkte Zustellung, sondern es seine E-Mails an Ihr Mailersend-Konto senden lassen, genauso wie Discourse es tut.

Auf diese Weise können Sie Discourse über eine der beiden Methoden senden lassen und die E-Mail in der Postfix-Warteschlange untersuchen, bevor sie gesendet wird.

Danke Michael – ich bin neu im Bereich „Inspektion am Draht“, aber hier ist, was ich gefunden habe.

MailerSend benötigt TLS und Port 587. Also:

  • Ich habe eine alternative app.yml erstellt, um an ein kostenloses Mailtrap.io-Konto über Port 2525 zu senden
  • DISCOURSE_SMTP_ENABLE_START_TLS = false gesetzt
  • die Änderung angewendet mit:
    cd /var/discourse
    ./launcher destroy app
    ./launcher start app
    
  • Wireshark eingerichtet, um Remote-Verkehr über tcpdump zu überwachen

Die E-Mail-Inhaltspakete in Wireshark und die unverschlüsselten E-Mails, die bei Mailtrap empfangen wurden, haben bisher keine fehlenden Leerzeichen. Spezifische Testzusammenfassungen, die nacheinander mit jeder Konfiguration ausgeführt wurden, weisen bei meiner ursprünglichen Konfiguration fehlende Leerzeichen auf, bei der Mailtrap-Version jedoch nicht. Könnte dies darauf hindeuten, dass das Problem durch die TLS-Verschlüsselung eingeführt wird?

EDIT: Mir ist eingefallen, dass ich das Mailtrap-Testsetup nicht vollständig genutzt habe. Ich habe inzwischen mehrere verschlüsselte Vorschau-Zusammenfassungen an Mailtrap gesendet – über Port 587 mit aktiviertem TLS – und keine fehlenden Leerzeichen gesehen. Ich denke jetzt, dass es, obwohl MailerSend mir sagte, dass die Probleme in den empfangenen Anfragen vorhanden waren, vielleicht doch auf deren Seite passiert? Ich bin mir nicht sicher, wonach sie suchen sollen, aber ich plane, ihnen diese Ergebnisse vorzulegen.

2 „Gefällt mir“

(Nur für den Fall, dass es hilft: Ich habe mir mein Setup kurz angesehen und kein Problem festgestellt. Daher würde ich mich fragen, ob Sie ein bestimmtes Theme oder Plugin haben, das Ihr Setup beeinflusst. Was ich getan habe, war, mail-tester.com zu besuchen, um ein temporäres Ziel zu erhalten, dann Admin->Emails->Preview Summary zu verwenden, um eine Zusammenfassung an das temporäre Ziel zu senden, und dann auf mail-tester zu klicken, um die HTML- und Plain-Versionen anzuzeigen. Es könnte sich lohnen, die gleiche Taktik auszuprobieren, um zu sehen, ob sich bei Ihnen etwas unterscheidet.)

Danke, Ed – damit meine E-Mails über meinen MailerSend-Relay an mail-tester gesendet werden, was ich aus der Kette entfernen wollte. Aber Ihr Kommentar hat mich dazu veranlasst, zu Mailtrap zurückzukehren und Tests mit TLS-Verschlüsselung durchzuführen, und ich habe meinen vorherigen Beitrag bearbeitet.

1 „Gefällt mir“

Ich finde das ebenfalls wahrscheinlich.

Für einen soliden Test würde ich als Nächstes eine der von Ihnen erfassten reinen Text-E-Mails nehmen und sie manuell über Ihr MailerSend-Konto mit openssl s_client übermitteln.