Pour les mots surveillés, je pense que cela pourrait être amélioré si des caractères Unicode similaires étaient également pris en compte.
Par exemple :
abcabcabc
𝘢𝘣𝘤𝘢𝘣𝘤𝘢𝘣𝘤
𝒂𝒃𝒄𝒂𝒃𝒄𝒂𝒃𝒄
ab𝘤𝘢𝘣𝒄𝒂𝒃𝒄
Cela permet essentiellement aux spammeurs de créer de nombreuses variations d’un même mot pour contourner le filtre de mots. J’ai été submergé par des spammeurs rusés et motivés, ce qui a vraiment poussé les fonctionnalités anti-spam de Discourse à leurs limites absolues. C’est l’une des techniques qu’ils utilisent.
Cela pourrait être utile : GitHub - janlelis/unicode-confusable: Unicode::Confusable.confusable? "ℜսᖯʏ", "Ruby" · GitHub