監視対象の単語については、類似する Unicode 文字も一致するように改善できればと思います。
例えば:
abcabcabc
𝘢𝘣𝘤𝘢𝘣𝘤𝘢𝘣𝘤
𝒂𝒃𝒄𝒂𝒃𝒄𝒂𝒃𝒄
ab𝘤𝘢𝘣𝒄𝒂𝒃𝒄
これにより、スパマーは同じ単語の多様なバリエーションを作成して単語フィルターを回避できるようになります。私は巧妙で意図的なスパマーに執拗に攻撃されており、Discourse のスパム対策機能がその限界まで試されています。これは彼らが使用している手法の一つです。
参考になるかもしれません:GitHub - janlelis/unicode-confusable: Unicode::Confusable.confusable? "ℜսᖯʏ", "Ruby" · GitHub