Para palavras monitoradas, acho que poderia ser melhorado se caracteres Unicode semelhantes também correspondessem.
Por exemplo:
abcabcabc
𝘢𝘣𝘤𝘢𝘣𝘤𝘢𝘣𝘤
𝒂𝒃𝒄𝒂𝒃𝒄𝒂𝒃𝒄
ab𝘤𝘢𝘣𝒄𝒂𝒃𝒄
Isso essencialmente permite que spammers criem muitas variações das mesmas palavras para contornar o filtro de palavras. Tenho sido alvo constante de spammers astutos e motivados, então eles realmente estão testando os recursos anti-spam do Discourse até o limite absoluto. Essa é uma das técnicas que estão usando.
Talvez isso possa ser útil: GitHub - janlelis/unicode-confusable: Unicode::Confusable.confusable? "ℜսᖯʏ", "Ruby" · GitHub