Акцентированные символы вызывают ложные срабатывания в списке отслеживаемых слов

JammyDodger · 24.Апрель.2023 18:23:07

При использовании функции «Слежение за словами» акцентированные символы могут вызывать ложные срабатывания, разбивая слово на части в месте акцента вместо того, чтобы рассматривать его как часть слова. Похоже, что фильтр слов воспринимает буквы с акцентами и диакритическими знаками как пробелы, а не как часть одного и того же слова.

Шаги для воспроизведения:

Добавьте слово «anal» в список заблокированных «Слежение за словами»
Войдите как пользователь без прав администратора и попробуйте использовать слово analógico в сообщении
Сообщение будет заблокировано

Попробуйте то же самое со словом analog — оно будет обработано корректно и разрешено к публикации.

nizar9 · 24.Апрель.2023 19:43:28

Мне удалось воспроизвести ту же проблему на моей стороне. Эта ошибка также затрагивает другие символы с седилью, такие как ç и ş:

nbianca · 18.Май.2023 15:06:25

Поддержка символов UTF-8 в отслеживаемых словах реализована в этом PR:

Это должно корректно определять границы слов для всех слов, включая те, которые содержат символы UTF-8.

nbianca · 22.Май.2023 05:00:14

Эта тема была автоматически закрыта через 3 дня. Новые ответы больше не принимаются.

Тема		Ответов	Просм.
Russian characters in Watched Words list are failing to be properly identified Bug watched-words	1	553	10.02.2021
Hope Watched words adds support for non-English characters Bug	1	85	16.02.2026
Test Watched Words is Broken Bug watched-words	2	538	09.06.2023
Watched words tricks Feature watched-words	5	1146	06.06.2020
Watched words: in Persian, content is affected without containing the word Support	6	780	09.05.2019

Акцентированные символы вызывают ложные срабатывания в списке отслеживаемых слов

Связанные темы