Смотрим слова и одностраничные блоки

Похоже, что содержимое Oneboxes не проходит фильтрацию по отслеживаемым словам.

На нашем форуме несколько человек ссылались на следующий комикс. Сам комикс безобиден, но в alt-тексте содержится нецензурное слово. Onebox подхватывает alt-текст и отображает его, однако функция отслеживания слов не помечает его как нарушающий правила. Казалось бы, фильтр отслеживаемых слов должен проверять и любой текст из onebox.

3 лайка

Согласен, это интересный пограничный случай, но насколько глубоко можно погружаться в эту тему? На изображении может оказаться нецензурное слово.

Мне кажется, в таких случаях имеет смысл просто полагаться на отметки пользователей.

4 лайка

Согласен, это частный случай. Я предполагал, что не составит труда получить текст одноблочного сообщения и затем выполнить проверку отслеживаемых слов, тогда как применение OCR к изображениям было бы непрактичным.

Ещё один быстрый подход для этого уникального частного случая — просто отфильтровать или удалить атрибут title для этого (или этих) элемента(ов) HTML IMG, добавив минимальный JavaScript в ваш(и) шаблон(ы).

Быстрый JS-фильтр, на мой взгляд, проще реализовать для сайтов, которые имеют строгие требования к фильтрации атрибута title для элемента HTML IMG:

(изображение с исходного сайта)

Надеюсь, это поможет @sciencewhiz

1 лайк