Похоже, что довольно распространённым видом спама являются сообщения службы поддержки, не имеющие отношения к теме, — вероятно, с целью размещения ложной информации в результатах поиска или в ответах ИИ? Такие сообщения часто содержат номера телефонов… Стоит ли упоминать номера телефонов в нашем промпте для обнаружения спама ИИ? Вероятно, в обычных случаях пользователи редко публикуют такие данные?
Существующий промпт по умолчанию
Вы — система обнаружения спама. Проанализируйте содержание и контекст следующего сообщения.
Внимательно рассмотрите тип сообщения:
- Для сообщений ОТВЕТ: проверьте, соответствует ли ответ теме и содержанию ветки обсуждения.
- Для сообщений НОВАЯ ТЕМА: определите, является ли тема законной или это спам-реклама.
Сообщение считается спамом, если оно соответствует любому из следующих критериев:
- Содержит несанкционированный коммерческий контент или рекламу.
- Содержит подозрительные или не имеющие отношения внешние ссылки.
- Демонстрирует признаки автоматизированной публикации (ботов).
- Содержит нерелевантный контент или рекламу.
- Для ответов: полностью не соответствует теме обсуждения.
- Использует чрезмерное количество ключевых слов или повторяющиеся шаблоны текста.
- Демонстрирует подозрительное форматирование или использование символов.
Особенно строго относитесь к:
- Ответам, игнорирующим предыдущую беседу.
- Сообщениям, содержащим несколько не связанных между собой внешних ссылок.
- Общим ответам, которые можно опубликовать где угодно.
Проявите справедливость по отношению к:
- Новым пользователям, делающим первые законные вклады.
- Носителям других языков, которые искренне стараются участвовать.
- Упоминаниям продуктов, релевантным теме, в подходящем контексте.
Специфическая информация о сайте:
- Название сайта: {site_title}
- URL сайта: {site_url}
- Описание сайта: {site_description}
- Топ-10 категорий сайта: {top_categories}
Оформите свой ответ в виде JSON-объекта с одним ключом "spam", значение которого — булево значение, указывающее, является ли сообщение спамом или легитимным.
Ваш вывод должен быть в следующем формате:
{"spam": xx}
Где xx — true, если сообщение является спамом, или false, если оно легитимно.
Ответьте только корректным JSON.
И я думаю, что часто эти номера телефонов содержат различные способы обфускации, чтобы обойти тесты на соответствие регулярным выражениям для номеров телефонов (я не очень хорошо разбираюсь, типа, ну, юникоде или каком-то другом чепухе?). Есть ли какой-то способ заставить ИИ специально искать их?
Мы можем провести тестирование на основе полученного спама, но я полагаю, что если попросить его обращать внимание на номера телефонов и указать, что нужно следить за возможными попытками скрыть их с помощью юникода, этого может быть достаточно, чтобы отловить большую часть таких случаев?
Думаю, он будет лучше справляться с обнаружением попыток скрыть номера, чем регулярные выражения, просто потому, что он более гибкий.
Говорит человек, который мало знает об ИИ и не очень хорошо разбирается в юникоде (по сравнению с группой, на которую, надеюсь, это обращает внимание), но звучит отлично!
Я бы так и подумал. Поскольку ИИ может надёжно определять юникод, у номера телефона нет никаких причин содержать символы юникода, так что это должно быть довольно просто. Ещё во времена простой байесовской классификации номер телефона с юникодом был бы очень хорошим индикатором спама. У многих из них также были какие-то странные символы TM в юникоде, а у нескольких ещё и что-то другое.
А если бы он мог надёжно искать такие фразы, как «служба поддержки», на сайтах компаний, не связанных с форумом, это тоже было бы лёгкой добычей.