Сканирует ли автоматизация триаги на основе ИИ личные сообщения между обычными пользователями?

Здравствуйте,

Я настроил автоматизацию «Триаж сообщений с помощью ИИ» для модерации контента на своей платформе (madeira.community — многоязычный бизнес-каталог острова Мадейра).

Автоматизация отлично работает для публичных публикаций. Однако я включил опцию «Включить личные сообщения» и обнаружил, что личные сообщения между обычными пользователями вообще не сканируются.

Мое беспокойство обосновано: злоумышленники могут использовать личные сообщения для незаконной деятельности — торговли наркотиками, распространения украденных финансовых данных, вербовки несовершеннолетних — полностью обходя модерацию с помощью ИИ, которая исправно работает с публичным контентом.

Мои вопросы:

  1. Действительно ли опция «Включить личные сообщения» поддерживает сканирование личных сообщений между двумя обычными пользователями (не сотрудниками)?

  2. Если нет — это сделано намеренно или это известное ограничение?

  3. Существует ли какой-либо поддерживаемый способ применить триаж с помощью ИИ к личным сообщениям между обычными пользователями?

Я нашел упоминание о коммите «По умолчанию пропускать сканирование личных сообщений при триаже с помощью LLM», что предполагает, что это может быть сделано намеренно. Но опция в интерфейсе существует — поэтому я не понимаю, что она на самом деле делает.

Спасибо

Да, поддерживает. Если вы включите эту опцию, сканирование личных сообщений должно работать.

Как вы это установили?

3 лайка

«Я протестировал это, отправив личное сообщение между двумя обычными пользователями (testUser и darinauser, оба не сотрудники) с явно незаконным содержанием: «кокаин. оружие. гранаты» и «порно. грязь. разврат. насилие». Сообщения были доставлены и не были помечены. Очередь на проверку осталась пустой. То же самое содержание в публичных постах было помечено сразу.»

Я могу подтвердить, что они не были обработаны: ID тем этих личных сообщений (210, 211, 212 и 214) и ID сообщений отсутствуют в таблице ai_api_audit_logs.

Думаю, что значение «Тип темы» «Все темы» означает все темы, кроме личных сообщений.
Не могли бы вы попробовать оставить это поле пустым?

2 лайка

"Это сработало! Спасибо, Ричард. Оставив поле “Тип темы” пустым, я исправил проблему — теперь личные сообщения между обычными пользователями сканируются.

Теперь я планирую настроить две отдельные автоматизации:

Одна для публичных постов с строгим промптом для модерации.
Вторая для личных сообщений с более мягким промптом — отмечать только самые серьёзные нарушения (CSAM, торговля наркотиками, оружие).

Таким образом, публичный контент будет проходить полную модерацию, а в частных переписках будут соблюдены более уместные границы."

Тему можно закрыть. Спасибо!

2 лайка

Хм, «все темы» в данном контексте действительно кажется немного непонятным… возможно, стоит обновить формулировку для уточнения

  • все темы темы (все категории)
  • Публичные темы (исключая все защищённые категории) темы (только публичные категории)
  • личные сообщения только
3 лайка

Раздел «Все темы» заставил меня подумать, что будет проверен весь контент.
Я даже не подумал, что оставление поля пустым приведёт к проверке всего контента.

1 лайк

Я считаю, что один выпадающий список довольно ограничен, а три отдельных варианта были бы лучше и, безусловно, понятнее для пользователя.

  • публичные темы: да/нет
  • непубличные темы: да/нет
  • личные сообщения: да/нет

Существует 8 возможных сценариев, а выпадающий список охватывает только четыре из них.

1 лайк

возможно?

  • Все (темы + личные сообщения)

  • Только публичные темы

  • Только непубличные темы

  • Непубличные темы + личные сообщения

  • Только личные сообщения

Это не охватывает «обычные темы (как публичные, так и непубличные), но без личных сообщений», что было бы вполне логичным выбором.

А также, хотя это менее вероятный вариант, «публичные темы и личные сообщения».

1 лайк