Wathed Wordsでアクセント文字が誤検出を引き起こす

Watched Words を使用する際、アクセント付き文字は単語の一部としてではなく、アクセント付き文字で単語を分割してしまうため、誤検知の原因となる可能性があります。単語フィルターは、アクセントやダイアクリティカルマーク付きの文字を、同じ単語の一部としてではなく、空白文字として扱っているようです。

再現手順:

  • ブロックする Watched Words に「anal」を追加します。
  • 非管理者ユーザーとして、投稿で analógico を使用しようとします。

  • 投稿はブロックされます。

analog で同じことを試すと、意図したとおりに機能し、投稿が許可されます。

「いいね!」 9

こちらでも同じ現象を再現できました。このバグは、ç や ş のようなセディーユ付きの他の文字にも影響するようです。

「いいね!」 3

このPRでUTF-8文字を監視単語でサポートするようになりました。

これにより、UTF-8文字を含むすべての単語の単語境界が正しく検出されるはずです。

「いいね!」 3

このトピックは3日後に自動的に閉じられました。新しい返信はもう許可されていません。