Стоит ли по умолчанию настраивать AI-сканер спама на пометку постов с номерами телефонов?

awesomerobot · 15.Сентябрь.2025 14:40:59

Похоже, что довольно распространённым видом спама являются сообщения службы поддержки, не имеющие отношения к теме, — вероятно, с целью размещения ложной информации в результатах поиска или в ответах ИИ? Такие сообщения часто содержат номера телефонов… Стоит ли упоминать номера телефонов в нашем промпте для обнаружения спама ИИ? Вероятно, в обычных случаях пользователи редко публикуют такие данные?

Существующий промпт по умолчанию

Вы — система обнаружения спама. Проанализируйте содержание и контекст следующего сообщения.

Внимательно рассмотрите тип сообщения:
- Для сообщений ОТВЕТ: проверьте, соответствует ли ответ теме и содержанию ветки обсуждения.
- Для сообщений НОВАЯ ТЕМА: определите, является ли тема законной или это спам-реклама.

Сообщение считается спамом, если оно соответствует любому из следующих критериев:
- Содержит несанкционированный коммерческий контент или рекламу.
- Содержит подозрительные или не имеющие отношения внешние ссылки.
- Демонстрирует признаки автоматизированной публикации (ботов).
- Содержит нерелевантный контент или рекламу.
- Для ответов: полностью не соответствует теме обсуждения.
- Использует чрезмерное количество ключевых слов или повторяющиеся шаблоны текста.
- Демонстрирует подозрительное форматирование или использование символов.

Особенно строго относитесь к:
- Ответам, игнорирующим предыдущую беседу.
- Сообщениям, содержащим несколько не связанных между собой внешних ссылок.
- Общим ответам, которые можно опубликовать где угодно.

Проявите справедливость по отношению к:
- Новым пользователям, делающим первые законные вклады.
- Носителям других языков, которые искренне стараются участвовать.
- Упоминаниям продуктов, релевантным теме, в подходящем контексте.

Специфическая информация о сайте:
- Название сайта: {site_title}
- URL сайта: {site_url}
- Описание сайта: {site_description}
- Топ-10 категорий сайта: {top_categories}

Оформите свой ответ в виде JSON-объекта с одним ключом "spam", значение которого — булево значение, указывающее, является ли сообщение спамом или легитимным.
Ваш вывод должен быть в следующем формате:

{"spam": xx}

Где xx — true, если сообщение является спамом, или false, если оно легитимно.
Ответьте только корректным JSON.

pfaffman · 15.Сентябрь.2025 15:53:55

И я думаю, что часто эти номера телефонов содержат различные способы обфускации, чтобы обойти тесты на соответствие регулярным выражениям для номеров телефонов (я не очень хорошо разбираюсь, типа, ну, юникоде или каком-то другом чепухе?). Есть ли какой-то способ заставить ИИ специально искать их?

awesomerobot · 15.Сентябрь.2025 16:06:14

Мы можем провести тестирование на основе полученного спама, но я полагаю, что если попросить его обращать внимание на номера телефонов и указать, что нужно следить за возможными попытками скрыть их с помощью юникода, этого может быть достаточно, чтобы отловить большую часть таких случаев?

Думаю, он будет лучше справляться с обнаружением попыток скрыть номера, чем регулярные выражения, просто потому, что он более гибкий.

pfaffman · 15.Сентябрь.2025 16:42:43

Говорит человек, который мало знает об ИИ и не очень хорошо разбирается в юникоде (по сравнению с группой, на которую, надеюсь, это обращает внимание), но звучит отлично!

Я бы так и подумал. Поскольку ИИ может надёжно определять юникод, у номера телефона нет никаких причин содержать символы юникода, так что это должно быть довольно просто. Ещё во времена простой байесовской классификации номер телефона с юникодом был бы очень хорошим индикатором спама. У многих из них также были какие-то странные символы TM в юникоде, а у нескольких ещё и что-то другое.

А если бы он мог надёжно искать такие фразы, как «служба поддержки», на сайтах компаний, не связанных с форумом, это тоже было бы лёгкой добычей.

sam · 15.Сентябрь.2025 23:23:40

Многое зависит от того, что нам нужны оценки:

У нас есть:

Что нам нужно сделать здесь:

Добавить большую порцию спам- и неспам-сообщений в набор для оценки (например, по 20–30 каждого типа)
Провести оценку
Исправить промпт
Снова провести оценку

Иначе мы работаем вслепую. cc @Falco

Тема		Ответов	Просм.
Discourse AI - Spam detection Site Management moderation , how-to , ai , spam	30	4475	10.03.2026
Are you experiencing AI based spam? Community Building ai	22	2256	19.01.2025
Setting up spam detection in your community Site Management moderation , automation , how-to , ai	10	2070	30.01.2025
Discourse AI to make spam filter smarter? Feature completed , ai	1	490	18.05.2024
Diagnosing spam attack of 100 topics Feature	34	3091	29.05.2017

Стоит ли по умолчанию настраивать AI-сканер спама на пометку постов с номерами телефонов?

Связанные темы