Watched Words Improvement -- 似たような Unicode 文字

markersocial · 2019 年 8 月 5 日午前 3:00

監視対象の単語については、類似する Unicode 文字も一致するように改善できればと思います。

例えば：
abcabcabc
𝘢𝘣𝘤𝘢𝘣𝘤𝘢𝘣𝘤
𝒂𝒃𝒄𝒂𝒃𝒄𝒂𝒃𝒄
ab𝘤𝘢𝘣𝒄𝒂𝒃𝒄

これにより、スパマーは同じ単語の多様なバリエーションを作成して単語フィルターを回避できるようになります。私は巧妙で意図的なスパマーに執拗に攻撃されており、Discourse のスパム対策機能がその限界まで試されています。これは彼らが使用している手法の一つです。

codinghorror · 2019 年 8 月 5 日午前 3:07

それは「フォント」ではなく、異なるUnicode文字セットです。

markersocial · 2019 年 8 月 5 日午前 3:17

ああ、すみません。ご指摘ありがとうございます。投稿を更新しました。

codinghorror · 2019 年 8 月 5 日午前 4:00

ありえません。そのような Unicode の「見た目」一致は CPU 時間を非常に多く消費し、また「何が何に似ているか」を誰が判断するのかという問題もあり、正しく実装するのは非常に厄介です。

スパマーに対処する他の方法を検討することをお勧めします。

当面は、必要な場合に Unicode の異なる文字を使ったスパム用語の一般的なバリエーションを追加してください。

トピック		返信	表示
Bypassing watched words with confusable character replacements Support watched-words	2	232	2024 年 12 月 17 日
Russian characters in Watched Words list are failing to be properly identified Bug watched-words	1	555	2021 年 2 月 10 日
Watched words to block recent spam attack Sysadmins watched-words , spam	12	415	2025 年 9 月 10 日
Hope Watched words adds support for non-English characters Bug	1	87	2026 年 2 月 16 日
Accented characters cause false postives in Watched Words Bug watched-words	2	489	2023 年 5 月 18 日