При добавлении переопределения направления текста слева направо текст в очереди проверки искажается. Версия форума: 3.5.0.beta2-dev
Могу ли я уточнить, что вы имеете в виду? Вы ссылаетесь на конкретную настройку сайта?
Я говорю о самом эмодзи, а не о чём-либо ещё: U+202E RIGHT-TO-LEFT OVERRIDE - Unicode Explorer
Если символ Unicode поместить в причину флага, это сломает текст.
Как это (в обратном порядке):
как это
Спасибо за сообщение об этом, @twofoursixeight. Судя по тому, как этот символ Unicode влияет на текст, причина блокировки отображается корректно, даже если выглядит искажённо — показывается текст именно так, как его ввёл пользователь. Также кажется, что отслеживаемые слова помечаются правильно, несмотря на обратное написание, так что не уверен, является ли это багом как таковым.
Помимо того, что текст в причине блокировки отображается задом наперёд (что ожидаемо, учитывая наличие символа Unicode), есть ли здесь ещё какие-либо проблемы?
Переопределение направления справа налево также можно использовать для обхода автоматической модерации, см. это:
без переопределения направления справа налево (Unicode):
с переопределением направления справа налево (обратите внимание на проверку грамматики? автокоррекция думает о другом слове!)
Что здесь происходит: просматриваемое слово отображается как f*ck, что будет отмечено модераторами. Однако, если вы вставите переопределение направления справа налево перед ним, вам нужно будет вводить текст в обратном порядке, то есть вместо этого: kc*f.
Фильтр просматриваемых слов не сможет правильно распознать слова благодаря этому переопределению.
Понял — это логично, и я вижу, как это может стать способом обхода спам-фильтров.
Как временное решение, пока мы не определимся с лучшим подходом для ядра, вы можете добавить этот символ Юникода в список отслеживаемых слов — тогда он будет помечаться в постах. Просто перейдите на страницу, которую вы указали, нажмите кнопку копирования и вставьте этот символ как новое отслеживаемое слово для пометки. Это приведёт к тому, что любой пост, содержащий его, будет помечен на проверку. Я только что проверил — это работает корректно.
Хотя у использования этого символа есть и легитимные сценарии (например, вставка текста на языке с направлением справа налево внутрь другого текста), он определённо может стать вектором для спама. Добавление его в список отслеживаемых слов поможет вам выявлять случаи его использования и проверять соответствующие посты по мере их появления. Тем временем мы изучим, какой будет лучший способ решения этой проблемы на уровне ядра.


