Сканирует ли автоматизация триаги на основе ИИ личные сообщения между обычными пользователями?

Здравствуйте,

Я настроил автоматизацию «Триаж сообщений с помощью ИИ» для модерации контента на своей платформе (madeira.community — многоязычный бизнес-каталог острова Мадейра).

Автоматизация отлично работает для публичных публикаций. Однако я включил опцию «Включить личные сообщения» и обнаружил, что личные сообщения между обычными пользователями вообще не сканируются.

Мое беспокойство обосновано: злоумышленники могут использовать личные сообщения для незаконной деятельности — торговли наркотиками, распространения украденных финансовых данных, вербовки несовершеннолетних — полностью обходя модерацию с помощью ИИ, которая исправно работает с публичным контентом.

Мои вопросы:

  1. Действительно ли опция «Включить личные сообщения» поддерживает сканирование личных сообщений между двумя обычными пользователями (не сотрудниками)?

  2. Если нет — это сделано намеренно или это известное ограничение?

  3. Существует ли какой-либо поддерживаемый способ применить триаж с помощью ИИ к личным сообщениям между обычными пользователями?

Я нашел упоминание о коммите «По умолчанию пропускать сканирование личных сообщений при триаже с помощью LLM», что предполагает, что это может быть сделано намеренно. Но опция в интерфейсе существует — поэтому я не понимаю, что она на самом деле делает.

Спасибо

Да, поддерживает. Если вы включите эту опцию, сканирование личных сообщений должно работать.

Как вы это установили?

«Я протестировал это, отправив личное сообщение между двумя обычными пользователями (testUser и darinauser, оба не сотрудники) с явно незаконным содержанием: «кокаин. оружие. гранаты» и «порно. грязь. разврат. насилие». Сообщения были доставлены и не были помечены. Очередь на проверку осталась пустой. То же самое содержание в публичных постах было помечено сразу.»

Я могу подтвердить, что они не были обработаны: ID тем этих личных сообщений (210, 211, 212 и 214) и ID сообщений отсутствуют в таблице ai_api_audit_logs.

Думаю, что значение «Тип темы» «Все темы» означает все темы, кроме личных сообщений.
Не могли бы вы попробовать оставить это поле пустым?

"Это сработало! Спасибо, Ричард. Оставив поле “Тип темы” пустым, я исправил проблему — теперь личные сообщения между обычными пользователями сканируются.

Теперь я планирую настроить две отдельные автоматизации:

Одна для публичных постов с строгим промптом для модерации.
Вторая для личных сообщений с более мягким промптом — отмечать только самые серьёзные нарушения (CSAM, торговля наркотиками, оружие).

Таким образом, публичный контент будет проходить полную модерацию, а в частных переписках будут соблюдены более уместные границы."

Тему можно закрыть. Спасибо!

Хм, «все темы» в данном контексте действительно кажется немного непонятным… возможно, стоит обновить формулировку для уточнения

  • все темы темы (все категории)
  • Публичные темы (исключая все защищённые категории) темы (только публичные категории)
  • личные сообщения только

Раздел «Все темы» заставил меня подумать, что будет проверен весь контент.
Я даже не подумал, что оставление поля пустым приведёт к проверке всего контента.

Я считаю, что один выпадающий список довольно ограничен, а три отдельных варианта были бы лучше и, безусловно, понятнее для пользователя.

  • публичные темы: да/нет
  • непубличные темы: да/нет
  • личные сообщения: да/нет

Существует 8 возможных сценариев, а выпадающий список охватывает только четыре из них.

возможно?

  • Все (темы + личные сообщения)

  • Только публичные темы

  • Только непубличные темы

  • Непубличные темы + личные сообщения

  • Только личные сообщения

Это не охватывает «обычные темы (как публичные, так и непубличные), но без личных сообщений», что было бы вполне логичным выбором.

А также, хотя это менее вероятный вариант, «публичные темы и личные сообщения».