Загрузка изображений — поддержка API распознавания изображений

markersocial · 23.Июнь.2020 04:55:06

В свете законов SESTA/FOSTA, которые фактически лишают многих владельцев веб-сайтов социальных сетей, форумов и платформ с пользовательским контентом (UGC) значительной части защиты (безопасная гавань по разделу 230), возлагая на них ответственность за действия своих пользователей, может быть разумным рассмотреть использование API распознавания изображений в качестве одного из решений для повышения уровня защиты. Это позволит автоматизировать блокировку загрузки контента откровенного характера (небезопасного, с изображением наготы, жестокости и т. д.).

Также это поможет повысить защиту от эксплойтов, связанных с загрузкой неуместных изображений в черновики, а затем их использованием через прямые ссылки в других местах, фактически превращая платформу в бесплатное анонимное хранилище изображений. Я не уверен, насколько это уязвимо в Discourse, но при настройках по умолчанию такая эксплуатация возможна в течение 180 дней после создания черновика, даже если владелец сайта не знает, что именно было загружено (например, функция удаления черновиков старше N дней).

Некоторые API:

Amazon Rekognition (заявлено, что он напрямую интегрируется с Machine Learning Workflow & Integrated Workflows - Amazon Augmented AI - AWS для проведения ручной проверки при необходимости).
Google Vision AI
Microsoft Computer Vision
Imagga

sam · 23.Июнь.2020 05:05:05

Это должно начинаться с плагина, и вряд ли когда-либо станет основной функцией Discourse.

Terrapop · 21.Август.2020 14:51:40

Было бы здорово проверять все изображения, загружаемые в Discourse через Google Cloud Vision API, чтобы оставаться в безопасности для AdSense. Мы делали это на нашем предыдущем сайте и никогда не сталкивались с загрузкой откровенно непристойных или жестоких изображений.

Google предоставляет Ruby-гем:

Потенциальный плагин должен интегрироваться в основной процесс загрузки изображений в Discourse для всех изображений (сообщения, аватары, фоны профилей и т. д.) и отклонять изображения, содержащие запрещённый контент:

  puts "Adult:    #{safe_search.adult}"  puts "Spoof:    #{safe_search.spoof}"  puts "Medical:  #{safe_search.medical}"  puts "Violence: #{safe_search.violence}"  puts "Racy:     #{safe_search.racy}"

['UNKNOWN', 'VERY_UNLIKELY', 'UNLIKELY',        'POSSIBLE', 'LIKELY', 'VERY_LIKELY']

В какую часть кодовой базы Discourse должен интегрироваться такой плагин?

Кто-нибудь заинтересован в разработке его через Marketplace?

fzngagan · 21.Август.2020 15:02:19

Это абсолютно возможно, но, на мой взгляд, это нарушит «бесшовность» пользовательского опыта. Если бы существовал способ встроить модель прямо в плагин, это было бы здорово.

Вы использовали сам Vision API?

Вот плагин, созданный @angus, который может служить отправной точкой: GitHub - angusmcleod/discourse-machine-learning · GitHub

Terrapop · 21.Август.2020 15:04:52

Что именно вы имеете в виду под «бесшовностью»?

fzngagan · 21.Август.2020 15:05:56

Я имею в виду, что перед загрузкой проверка изображения путём отправки его через POST-запрос к API и получения зелёного флага займёт какое-то время, верно?

Terrapop · 21.Август.2020 15:13:54

Ну, процесс загрузки встроенных изображений, на мой взгляд, уже асинхронный. А Google API работает очень быстро.

С другой стороны, я также был бы рад проверять изображения после того, как пользователь опубликовал новый пост, используя внешний веб-хук (Discourse API), и редактировать пост пользователя (например, удалять изображение и заменять его текстом «ИЗОБРАЖЕНИЕ УДАЛЕНО АДМИНИСТРАТОРОМ»). Эта часть, кажется, возможна через API, но я не могу найти никаких ссылок на то, как на самом деле УДАЛИТЬ «плохое» изображение через API в таком случае, потому что я даже не хочу хранить его где-то в тени.

fzngagan · 22.Август.2020 04:25:06

Я с радостью займусь этим как платным проектом. Можете ли вы помочь с частью, касающейся API, то есть какой API используется для обнаружения оскорбительного контента и т. д.?

Terrapop · 22.Август.2020 06:06:36

Всё очень хорошо документировано здесь для Ruby:

В PHP мы внедрили это в Drupal менее чем за 2 часа.

fzngagan · 22.Август.2020 06:37:30

2 часов должно быть достаточно для этого. Стоит ли мне отправить тебе личное сообщение по этому поводу?

Terrapop · 22.Август.2020 06:48:36

Да, пожалуйста. Это было бы здорово.

markersocial · 23.Август.2020 10:03:25

@Terrapop — Стоит учесть точность распознавания. Иногда полезно видеть часть заблокированного контента, чтобы убедиться, что настройки для уровней «POSSIBLE», «LIKELY» и «VERY_LIKELY» не слишком строгие. Ложные срабатывания и пропуски встречаются довольно часто.

Кажется, лучше реализовать отправку всех постов с изображениями, превышающими определённый уровень «возможной adult-контентности», в очередь на проверку. Так пост никогда не станет публичным, но вы сможете одобрить его, если распознавание оказалось неточным. Если пост будет отклонён, изображения, как я понимаю, будут удалены по истечении периода, заданного в параметре «clean_orphan_uploads_grace_period_hours».

Это позволит с большей уверенностью использовать уровень обнаружения «POSSIBLY».

Terrapop · 23.Август.2020 10:40:54

Мы протестировали API на нашем текущем сайте и выяснили, какие уровни подходят нам лучше всего.

@fzngagan разрабатывает для нас плагин с открытым исходным кодом, поэтому после завершения вы сможете внести изменения и отправить запрос на добавление опции, которая не будет сразу отклонять, а перенаправлять в очередь модерации.

fzngagan · 18.Сентябрь.2020 12:56:55

Вот плагин.

Мне нравится идея связать вероятность с очередями проверки, когда изображение является частью поста. Готов принять спонсорскую поддержку или PR в этом отношении.

Terrapop · 18.Сентябрь.2020 18:24:39

Если это опциональное дополнение сверху, то для меня это, конечно, приемлемо.

Мы довольно долгое время использовали API в нашем предыдущем сообществе и знаем, какие уровни для нас допустимы. В большинстве случаев API правильно отказывал, и пользователь просто загружал менее серьёзное изображение.

Также я хотел, чтобы проверялись не только посты, но и загрузка изображений для аватаров и фонов профиля. Не знаю, возможна ли для них очередь?

Тема		Ответов	Просм.
[PAID] Integrate Google Cloud Vistion API into upload process Marketplace	1	939	22.08.2020
Is there a way to restrict/flag explicit videos automatically? Support	3	437	03.06.2021
Legal Compliance Plugin Plugin online-safety-act	5	636	13.04.2025
NSFW image blurring in chat Support chat , ai	4	692	27.08.2024
Setting up NSFW detection in your community Site Management moderation , automation , how-to , ai	0	1374	10.10.2024

Загрузка изображений — поддержка API распознавания изображений

Связанные темы