Watched Words を使用する際、アクセント付き文字は単語の一部としてではなく、アクセント付き文字で単語を分割してしまうため、誤検知の原因となる可能性があります。単語フィルターは、アクセントやダイアクリティカルマーク付きの文字を、同じ単語の一部としてではなく、空白文字として扱っているようです。
再現手順:
ブロックする Watched Words に「anal」を追加します。
非管理者ユーザーとして、投稿で analógico を使用しようとします。
投稿はブロックされます。
analog で同じことを試すと、意図したとおりに機能し、投稿が許可されます。
「いいね!」 9
nizar9
2023 年 4 月 24 日午後 7:43
3
こちらでも同じ現象を再現できました。このバグは、ç や ş のようなセディーユ付きの他の文字にも影響するようです。
「いいね!」 3
nbianca
(Bianca)
2023 年 5 月 18 日午後 3:06
10
このPRでUTF-8文字を監視単語でサポートするようになりました。
main ← fix_utf8
opened 07:17PM - 02 May 23 UTC
Watched words were converted to regular expressions containing \W, which handled… only ASCII characters. Using [^[:word]] instead ensures that UTF-8 characters are also handled correctly.
これにより、UTF-8文字を含むすべての単語の単語境界が正しく検出されるはずです。
「いいね!」 3
nbianca
(Bianca)
クローズされました:
2023 年 5 月 22 日午前 5:00
11
このトピックは3日後に自動的に閉じられました。新しい返信はもう許可されていません。