Discourse AI - Обнаружение спама

pfaffman · 28.Август.2025 15:35:03

И он — пример того же спамера, которого здесь поймали: https://meta.discourse.org/t/full-list-of-quickbooks-desktop-support-contact-numbers-a-complete-call-center-in-the-usa/380776 (ссылка уже скрыта).

Эти ребята точно усердно работают.

haydenjames · 03.Сентябрь.2025 13:12:42

Отличная работа над этой функцией. Именно так я и хочу видеть применение ИИ.

Вопрос: когда новый пользователь TL0 отправляет ответ или тему, есть ли задержка, пока контент сканируется?

В встроенном тестере я вижу короткую задержку (скриншот ниже), но при публикации с тестового аккаунта аналогичной паузы нет. Сканирование в реальном времени происходит асинхронно после публикации, и пост скрывается только в случае срабатывания правила? (контекст: я использую API OpenAI ChatGPT 5.)

Кстати, счётчики AI > Spam & Stats увеличиваются как положено при использовании тестового аккаунта, значит пост действительно сканируется; просто он не создаёт такой же задержки, как кнопка Test.

Спасибо.

stance455 · 25.Сентябрь.2025 10:52:28

Всё работает неплохо, но что происходит, когда система помечает десятки тем или пользователей? Я не вижу способа массово забанить или удалить этих пользователей или посты.

sps · 03.Февраль.2026 19:49:04

Спасибо за подробную тему. На нашем экземпляре включено обнаружение спама с помощью Discourse AI, и мы наблюдаем, что по умолчанию происходит автоматическое заглушение, когда первый пост аккаунта помечается как спам.

Я понимаю, что это предназначено для блокировки спамеров, делающих один пост; однако это вызывает проблемы, так как одобрение/принятие жалобы приводит к тому, что пользователь остаётся заглушенным в тех случаях, когда мы хотим одобрить жалобу, но не заглушать пользователя. Было бы полезно иметь:

кнопку «Согласиться и оставить заглушенным» и
отдельную кнопку «Согласиться и снять заглушение».

sam · 03.Февраль.2026 23:57:09

Это сложный момент: мы не хотим парализовать людей выбором, но я полностью понимаю, что в масштабе это может стать проблемой.

Давайте я уточню у команды Enterprise XP — возможно, мы сможем внести небольшую кастомизацию для вашего форума.

singi2016cn · 28.Февраль.2026 03:52:09

Я опубликовал тестовый спам-тему в локальной среде разработки, но она автоматически не попала в очередь на модерацию.

Результат проверки ИИ действительно указывает на спам.

Также выполнены и другие условия для попадания в очередь на модерацию:

Уровень доверия пользователя:
- Сканируются посты пользователей с уровнем доверия 1 или ниже.
- Исключаются посты пользователей с более высоким уровнем доверия.
Тип поста:
- Публичные посты (личные сообщения не включены).
- Включая ответы и первые посты в темах, в зависимости от других пороговых значений.
Редактирование постов:
- Сканируются посты с существенными изменениями (например, изменение более 10 символов).
- Между сканированиями одного и того же поста enforced задержка в 10 минут.
Частота постов:
- Приоритет отдается новым пользователям, опубликовавшим менее 4 постов в публичных темах.
- Исключаются посты пользователей, превысивших этот порог.

Однако в итоге пост не попал в очередь на модерацию.

Что мне следует проверить, чтобы найти проблему?

per1234 · 28.Февраль.2026 04:11:17

Привет, @singi2016cn.

Вы имеете в виду, что проверили это с помощью инструмента тестирования?

sam:

Тестирование поведения сканера спама

Вы можете напрямую протестировать правила обнаружения спама со страницы конфигурации.

Изображение показывает результат обнаружения спама для сообщения в форуме meta Discourse, указывающий, что сообщение отправлено пользователем sam. (Подпись добавлена ИИ)762×961 60.7 KB

Вставьте URL или ID сообщения в поле теста.

Изучите результат классификации (например, «SPAM» или «NOT SPAM») и проанализируйте логи, чтобы понять логику работы.

Несохранённые изменения применяются во время тестирования, что позволяет экспериментировать без риска.

Вы можете получить доступ к этому инструменту, следуя этим инструкциям:

Войдите в учётную запись на вашем форуме с правами администратора.
Перейдите на эту страницу на вашем форуме: /admin/plugins/discourse-ai/ai-spam
Нажмите кнопку “Test…” на этой странице.
Откроется диалоговое окно “Test spam detection”.
Введите URL или ID вашего тестового спам-сообщения в поле “Post URL or ID” в диалоговом окне.
Нажмите кнопку “Run test”.

singi2016cn · 28.Февраль.2026 06:24:16

Да, инструмент тестирования однозначно вернул «Спам», но когда я опубликовал тот же самый контент, он не попал в очередь на модерацию.

Moin · 28.Февраль.2026 10:59:52

Кто это опубликовал? Вы использовали нового пользователя, созданного для тестирования, или, например, учётную запись с правами модератора?

singi2016cn · 02.Март.2026 01:20:32

Обычный пользователь, уровень доверия 1, не администратор и не модератор.

LotusJeff · 10.Март.2026 02:34:56

Вот набор пользовательских инструкций, который я использую для обнаружения спама. Он более подробный, чем стандартная версия, поэтому потребляет больше токенов. Какие наборы пользовательских инструкций используют другие для обнаружения спама?

## Краткий набор инструкций для обнаружения спама

Вы — система обнаружения спама, проверяющая сообщения на форуме.

Ваша задача — определить, направлено ли сообщение в первую очередь на продвижение, обман, манипуляцию рейтингами в поисковых системах, распространение вредоносных ссылок или срыв обсуждений, а не на искреннее участие в жизни сообщества.

Оцените:

* Содержимое сообщения
* Тип сообщения (ОТВЕТ ИЛИ НОВАЯ ТЕМУ)
* Контекст темы (для ответов)
* Сведения о сайте

---

### Классифицируйте как спам, если сообщение:

* Продвигает товары, услуги или внешние сайты без содержательного взаимодействия
* Содержит подозрительные, нерелевантные или множественные рекламные ссылки
* Использует нагромождение ключевых слов в стиле SEO или повторяющиеся шаблоны
* Выглядит автоматизированным, шаблонным или сгенерированным ботом
* Не имеет отношения к теме форума
* Для ОТВЕТОВ: игнорирует тему и вставляет нерелевантный контент

Сильные индикаторы спама включают:

* Партнерские/реферальные ссылки
* Фразы «купить сейчас», скидки или рекламный язык
* Контактная информация, не имеющая отношения к обсуждению
* Общее хвалебное сообщение + ссылка
* Структура копипаста
* Бессмысленный или сгенерированный ИИ текст

---

### НЕ классифицируйте как спам только потому, что:

* Пользователь новичок
* Английский язык использован с ошибками
* Сообщение короткое
* Тон восторженный
* В контексте упоминается релевантный товар или поставщик

Признаки легитимности включают:

* Конкретные отсылки к теме
* Техническое обсуждение, релевантное теме
* Искренние вопросы
* Личный опыт, связанный с темой форума

---

### Правило принятия решения

Если основная цель кажется рекламной, вредоносной или разрушительной → spam = true.
Если сообщение содержательно участвует в обсуждении → spam = false.

В случае сомнений, но при наличии нескольких красных флагов, приоритет отдавайте безопасности сообщества.

---

### Формат вывода

Верните только допустимый JSON:

{"spam": true или false, "reason": "Краткое объяснение (1–2 предложения)."}

Не включайте дополнительных комментариев.

LotusJeff · 10.Март.2026 16:04:58

На странице Администратор > Плагины > ИИ > СПАМ должен быть отчёт, отображающий детали сводной панели. Сводная панель показывает количество проанализированных сообщений, обнаруженных спамеров, а также ложные срабатывания и пропущенные случаи.

Существует ли где-то детальный отчёт, который я не нашёл?
Есть ли запрос в Data Explorer, предоставляющий детальную информацию на низком уровне?

Заранее спасибо.

Falco · 10.Март.2026 16:52:36

Этот запрос предоставляет все детали

SELECT * FROM ai_spam_logs ORDER BY 1 DESC LIMIT 50

Тема		Ответов	Просм.
Setting up spam detection in your community Site Management moderation , automation , how-to , ai	10	2070	30.01.2025
AI powered Spam detection Announcements ai , spam	11	1139	11.01.2025
AI spam bot says it is not spam but scan log says it is spam Bug ai	7	256	22.08.2025
Are you experiencing AI based spam? Community Building ai	22	2256	19.01.2025
Discourse AI to make spam filter smarter? Feature completed , ai	1	490	18.05.2024

Discourse AI - Обнаружение спама

Связанные темы