Watched Words Improvement -- 似たような Unicode 文字

監視対象の単語については、類似する Unicode 文字も一致するように改善できればと思います。

例えば:
abcabcabc
𝘢𝘣𝘤𝘢𝘣𝘤𝘢𝘣𝘤
𝒂𝒃𝒄𝒂𝒃𝒄𝒂𝒃𝒄
ab𝘤𝘢𝘣𝒄𝒂𝒃𝒄

これにより、スパマーは同じ単語の多様なバリエーションを作成して単語フィルターを回避できるようになります。私は巧妙で意図的なスパマーに執拗に攻撃されており、Discourse のスパム対策機能がその限界まで試されています。これは彼らが使用している手法の一つです。

参考になるかもしれません:GitHub - janlelis/unicode-confusable: Unicode::Confusable.confusable? "ℜսᖯʏ", "Ruby" · GitHub

「いいね!」 2

それは「フォント」ではなく、異なるUnicode文字セットです。

「いいね!」 2

ああ、すみません。ご指摘ありがとうございます。投稿を更新しました。

ありえません。そのような Unicode の「見た目」一致は CPU 時間を非常に多く消費し、また「何が何に似ているか」を誰が判断するのかという問題もあり、正しく実装するのは非常に厄介です。:thinking:

スパマーに対処する他の方法を検討することをお勧めします。

当面は、必要な場合に Unicode の異なる文字を使ったスパム用語の一般的なバリエーションを追加してください。

「いいね!」 3