Watched Words Improvement -- ähnlich aussehende Unicode-Zeichen

Bei beobachteten Wörtern könnte es meiner Meinung nach verbessert werden, wenn auch ähnliche Unicode-Zeichen übereinstimmen würden.

Zum Beispiel:
abcabcabc
𝘢𝘣𝘤𝘢𝘣𝘤𝘢𝘣𝘤
𝒂𝒃𝒄𝒂𝒃𝒄𝒂𝒃𝒄
ab𝘤𝘢𝘣𝒄𝒂𝒃𝒄

Das ermöglicht es Spammern im Wesentlichen, viele Variationen derselben Wörter zu nutzen, um den Wortfilter zu umgehen. Ich werde von cleveren, motivierten Spammern regelrecht bombardiert, sodass sie die Anti-Spam-Funktionen von Discourse an die absolute Grenze gebracht haben. Dies ist eine der Techniken, die sie einsetzen.

Vielleicht könnte Folgendes nützlich sein: GitHub - janlelis/unicode-confusable: Unicode::Confusable.confusable? "ℜսᖯʏ", "Ruby" · GitHub

2 „Gefällt mir“

Das ist keine ‘Schriftart’, das ist ein anderer Satz von Unicode-Zeichen.

2 „Gefällt mir“

Ah, mein Fehler, danke für die Korrektur. Beitrag aktualisiert.

Unwahrscheinlich, da eine solche Unicode-„sieht aus wie“-Übereinstimmung extrem rechenintensiv ist und zudem sehr fehleranfällig ist, denn wer entscheidet eigentlich, was wie etwas anderes „aussieht“? :thinking:

Ich schlage vor, dass du andere Methoden in Betracht ziehst, um mit diesen Spam-Absendern umzugehen.

In der Zwischenzeit kannst du einfach gängige Variationen von Spam-Begriffen in verschiedenen Unicode-Zeichen nach Bedarf hinzufügen.

3 „Gefällt mir“