Surveillance des améliorations de mots -- caractères Unicode visuellement similaires

markersocial · Août 5, 2019, 3:00

Pour les mots surveillés, je pense que cela pourrait être amélioré si des caractères Unicode similaires étaient également pris en compte.

Par exemple :
abcabcabc
𝘢𝘣𝘤𝘢𝘣𝘤𝘢𝘣𝘤
𝒂𝒃𝒄𝒂𝒃𝒄𝒂𝒃𝒄
ab𝘤𝘢𝘣𝒄𝒂𝒃𝒄

Cela permet essentiellement aux spammeurs de créer de nombreuses variations d’un même mot pour contourner le filtre de mots. J’ai été submergé par des spammeurs rusés et motivés, ce qui a vraiment poussé les fonctionnalités anti-spam de Discourse à leurs limites absolues. C’est l’une des techniques qu’ils utilisent.

Cela pourrait être utile : GitHub - janlelis/unicode-confusable: Unicode::Confusable.confusable? "ℜսᖯʏ", "Ruby" · GitHub

codinghorror · Août 5, 2019, 3:07

Ce n’est pas une « police », c’est un ensemble différent de caractères Unicode.

markersocial · Août 5, 2019, 3:17

Ah, désolé, merci pour la correction. J’ai mis à jour le post.

codinghorror · Août 5, 2019, 4:00

Peu probable, car ce type de correspondance de type « ressemble à » avec l’Unicode est extrêmement coûteux en temps CPU et très délicat à mettre en œuvre correctement, car qui décide de ce qui « ressemble à » autre chose ?

Je vous suggère d’envisager d’autres méthodes pour faire face à ces spammers.

En attendant, ajoutez simplement les variations courantes des termes de spam, au besoin, en utilisant différents caractères Unicode.

Sujet		Réponses	Vues
Bypassing watched words with confusable character replacements Support watched-words	2	232	Décembre 17, 2024
Russian characters in Watched Words list are failing to be properly identified Bug watched-words	1	555	Février 10, 2021
Watched words to block recent spam attack Sysadmins watched-words , spam	12	416	Septembre 10, 2025
Hope Watched words adds support for non-English characters Bug	1	89	Février 16, 2026
Accented characters cause false postives in Watched Words Bug watched-words	2	489	Mai 18, 2023

Surveillance des améliorations de mots -- caractères Unicode visuellement similaires

Sujets connexes