Всем привет! Я использую Discourse уже около 9 лет на форуме Home Assistant. Также я являюсь модератором уже несколько лет. В последнее время мы столкнулись с огромным наплывом спамеров. Мне интересно, что мы можем сделать, чтобы облегчить эту проблему.
Во-первых, кажется, что ключевые слова, регулярные выражения и т.д. требуют некоторого времени, прежде чем сообщения будут помечены как спам. Это ограничение связано с нашими серверами, или есть способ увеличить скорость? Учтите, что у нас сейчас около 270 тысяч пользователей, и мы в среднем получаем около 100 новых пользователей в день (не считая спамеров).
Во-вторых, спамеры стали умнее, особенно в отношении этого программного обеспечения форума. У них есть две формы атаки.
Они создают сообщение с бессмыслицей. Просто набор английских и неанглийских слов, соединенных вместе. Это позволяет им обойти спам-фильтры. Затем они редактируют сообщение, чтобы разместить спам, который они продвигают.
Они создают тему, затем отвечают на неё и отмечают ответ как решение. Когда мы пытаемся удалить/заблокировать этого спамера, Discourse возвращает ошибку 500, конкретно из-за флажка решения. По какой-то причине нельзя удалить пользователя, у которого есть решение.
Как все справляются с этими проблемами?
По второму вопросу мы попытались ограничить флажок решения более высоким уровнем доверия. Однако настройки или сам флажок решения просто включены или выключены. То есть в флажок решения не встроены уровни доверия.
Пока я здесь, у меня также есть несколько замечаний по поводу инструментов модерации. Мне кажется очень странным, что все ссылки в журналах действий персонала просто не работают. Все они ведут на журналы действий персонала. Например, все ссылки, обведенные на этой странице, не ведут к темам или сообщениям.
Один из вариантов — переключиться на новую систему одобрения пользователей. Повысить уровень доверия в категориях с помощью плагина «solved» до уровня tl1 или tl2.
Ограничить новых пользователей доступом только к определённым категориям.
Несколько полезных категорий, использующих новый плагин Doc-categories (возможно, удобнее получать доступ через боковую панель). Однако перейдите по этим двум ссылкам:
Для поиска по этим категориям используйте следующее в поиске:
Это выполнит поиск в категории Documentation:
#documentation ваш поисковый запрос
Это выполнит поиск в категории community wiki:
#community-wiki ваш поисковый запрос
Также существуют некоторые плагины, которые могут помочь. Если вы используете хостинг, вам нужно проверить, доступны ли они в вашем тарифном плане. Если вы используете собственный хостинг, у вас больше свободы для установки плагинов, но вам может потребоваться помощь, если сайт сломается и вы не сможете это исправить самостоятельно.
Некоторые плагины:
Ниже приведён официальный плагин, поэтому вероятность поломки меньше:
Мы пробовали это: в результате приходится утверждать по 100 и более сообщений в день от модераторов. Почти все новые пользователи сразу пишут пост. Если бы существовал процесс массового утверждения, это было бы не так обременительно.
Кроме того, новые пользователи создавали несколько первых постов, потому что первый не проходил проверку. За один день после четырёхчасового перерыва у меня было 59 таких сообщений, из которых два оказались спамом. Я пытаюсь найти золотую середину.
РЕДАКТИРОВАНИЕ: Подождите, я неправильно прочитал этот цитату.
К сожалению, это совсем не поможет в форуме HA, так как именно новые пользователи чаще всего нуждаются в помощи.
Мы пробовали одобрение новых пользователей, а также требовать одобрения для первых нескольких сообщений, но это лишь значительно увеличивает нагрузку на модерацию.
К сожалению, насколько мне известно, нет простого способа бороться со спам-аккаунтами без некоторых сложностей.
Если новые пользователи часто, так сказать, рекомендуются другими пользователями или приглашаются вашей командой, система ссылок-приглашений может оказаться полезной. Ссылку можно настроить сотрудниками (администраторами?), чтобы установить уровень доверия выше 0.
Тем не менее, вы всё ещё можете ограничить новых пользователей, не пришедших по приглашению, запретив им доступ к определённым «категориям приёма» на уровне доверия 0 (новый пользователь).
В противном случае стоит рассмотреть два плагина, связанных со спамом. Также существуют некоторые плагины на основе ИИ, но их использование сопряжено с затратами на функции искусственного интеллекта.
Теперь я понял. У меня нет доступа к этому интерфейсу, поэтому мне приходится делать предположения. Я перешлю это администраторам, надеюсь, это даст нам то, что нужно.
Да, обычно требуется уровень администратора. Однако, если администраторы не против, есть возможность разрешить полным модераторам сайта управлять категориями.
Вы также можете цитировать сообщения здесь и использовать функцию «Копировать цитату», чтобы отправить их на ваш форум вашей команде или администратору, например, в частную категорию для персонала или в личное сообщение/групповое сообщение.
Вы также можете использовать ссылки на сообщения здесь, чтобы помочь вашей команде.
Я изучил общие настройки плагина Solved. На мой взгляд, делать это по каждой категории немного неудобно. Однако я заметил, что, вероятно, можно увеличить параметр create topic allowed groups с 0 до 1 и немного снизить требования для получения уровня доверия 1. У нас он уже на приемлемом уровне, и я считаю, что снижение нескольких требований не создаст большой нагрузки для команды модерации.
Звучит ли это как решение, которое вы бы предложили? Petro, Rosemary — не помешает ли это слишком сильно нашим реальным новым участникам?
Это могло бы сработать. Хотя, возможно, это усложнит новым пользователям процесс создания тем.
По-настоящему хитрые спамеры даже с учётом моих предложений выше могли бы сохранить упомянутые плагины. Они могли бы пройти обучение для новых пользователей, чтобы повысить свой уровень.
Однако кажется, что спамеров интересуют лишь быстрые обходные пути.
Это немного утомительно, если у вас много категорий, которые нужно настроить при использовании безопасности категорий.
Один из более опытных участников здесь, возможно, знает команду Rails для изменения настроек всех категорий через командную строку. Тогда вам, возможно, потребуется лишь настроить некоторые категории, которые вы хотите, так сказать, с открытым доступом или с более строгими ограничениями.
Я изучил некоторые данные по этой теме. У нас примерно ~200 новых регистраций в день, из которых от 25 до 50% делают свои первые посты (~100 в день; я не вижу связи между новыми пользователями и их первыми постами, поэтому эти цифры приблизительные), и около 80 пользователей ежедневно достигают уровня доверия 1.
Это кажется достаточно безопасным вариантом, чтобы пойти по пути, который я нашел. Я обсудлю это с моими модераторами и затем вернусь с ответом здесь. Всегда полезно иметь эмпирические знания о том, что работает для некоторых, и тогда мы сможем закрыть этот вопрос, если что-то работает хорошо, или обсудить потенциальные решения, если нет.
Да, иногда всё может быть довольно изнурительно. Особенно если у вас наплыв спамеров. В настройках администратора есть ещё один инструмент: если вы выявите пользователей, использующих временные электронные адреса, вы можете добавить домены таких почтовых сервисов в чёрный список доменов. Я могу попробовать получить список одного из сайтов, где я являюсь администратором. Не уверен, получится ли их экспортировать в текстовом виде, но скриншот точно смогу сделать. Сайтов очень много, поэтому получить все практически невозможно.
Если вам понадобится помощь, вы также можете связаться со мной через личные сообщения.
Стоит обратить внимание на наш плагин AI, который теперь включает функцию сканирования спама с помощью ИИ и может помечать сообщения.
Мы уже некоторое время используем эту функцию на Meta и обнаружили, что она эффективнее других систем в выявлении спама, который мог бы пройти сквозь них. Кроме того, если вы столкнулись с определённым типом спама, вы можете предоставить собственные инструкции для настройки работы плагина.
Сканирование спама на основе Discourse AI не уязвимо к этому.
Кроме того, у нас есть меры защиты, которые запрещают редактирование постов, если они уже существуют давно.
Если это воспроизводится, нам нужен отчет об ошибке; мы бы хотели это исправить.
На данный момент я считаю, что Akismet не способен справляться с текущим паттерном спама в интернете — у него слишком много ложноотрицательных результатов.
Discourse AI работает очень хорошо. Вы можете настроить его на своем собственном хостинге бесплатно, используя модель, такую как Gemini Flash 2.0, которая отлично справляется со спамом.
Можете ли вы попробовать и сообщить о результатах?