Per le parole monitorate, penso che si potrebbe migliorare il sistema facendo corrispondere anche i caratteri Unicode simili.
Ad esempio:
abcabcabc
π’π£π€π’π£π€π’π£π€
πππππππππ
abπ€π’π£ππππ
Questo permetterebbe essenzialmente agli spammer di creare molte varianti delle stesse parole per aggirare il filtro delle parole. Sono stato bombardato da spammer astuti e motivati, che hanno messo alla prova le funzionalitΓ anti-spam di Discourse fino al limite assoluto. Questa Γ¨ una delle tecniche che stanno utilizzando.
Forse potrebbe essere utile: GitHub - janlelis/unicode-confusable: Unicode::Confusable.confusable? "βΥ½α―Κ", "Ruby" Β· GitHub