Акцентированные символы вызывают ложные срабатывания в списке отслеживаемых слов

При использовании функции «Слежение за словами» акцентированные символы могут вызывать ложные срабатывания, разбивая слово на части в месте акцента вместо того, чтобы рассматривать его как часть слова. Похоже, что фильтр слов воспринимает буквы с акцентами и диакритическими знаками как пробелы, а не как часть одного и того же слова.

Шаги для воспроизведения:

  • Добавьте слово «anal» в список заблокированных «Слежение за словами»
  • Войдите как пользователь без прав администратора и попробуйте использовать слово analógico в сообщении

  • Сообщение будет заблокировано

Попробуйте то же самое со словом analog — оно будет обработано корректно и разрешено к публикации.

9 лайков

Мне удалось воспроизвести ту же проблему на моей стороне. Эта ошибка также затрагивает другие символы с седилью, такие как ç и ş:

3 лайка

Поддержка символов UTF-8 в отслеживаемых словах реализована в этом PR:

Это должно корректно определять границы слов для всех слов, включая те, которые содержат символы UTF-8.

3 лайка

Эта тема была автоматически закрыта через 3 дня. Новые ответы больше не принимаются.