Lorsque vous utilisez des mots surveillés, les caractères accentués peuvent entraîner des faux positifs en divisant un mot sur le caractère accentué plutôt qu’en le traitant comme faisant partie du mot. Il semble que le filtre de mots traite les lettres avec des accents et des diacritiques comme des espaces vides au lieu de faire partie du même mot.
Étapes de reproduction :
Ajoutez « anal » aux mots surveillés bloqués
En tant qu’utilisateur non administrateur, tentez d’utiliser analógico dans une publication
La publication est bloquée
Tenter la même chose avec analog fonctionne comme prévu et est autorisé à être publié.
9 « J'aime »
J’ai pu reproduire la même chose de mon côté. Ce bug inclut également d’autres caractères avec une cédille comme ç et ş :
3 « J'aime »
nbianca
(Bianca)
Mai 18, 2023, 3:06
10
La prise en charge des caractères UTF-8 dans les mots surveillés a été implémentée dans cette PR :
main ← fix_utf8
opened 07:17PM - 02 May 23 UTC
Watched words were converted to regular expressions containing \W, which handled… only ASCII characters. Using [^[:word]] instead ensures that UTF-8 characters are also handled correctly.
Cela devrait détecter correctement les limites de mots pour tous les mots, y compris ceux qui contiennent des caractères UTF-8.
3 « J'aime »
nbianca
(Bianca)
A fermé ce sujet ()
Mai 22, 2023, 5:00
11
Ce sujet a été automatiquement fermé après 3 jours. Les nouvelles réponses ne sont plus autorisées.