Всем привет,
Я хотел бы предложить фильтр с поддержкой ИИ для низкокачественных / бессмысленных ответов («водные ответы», шаблонные спам-комментарии) внутри тем.
Проблема
Во многих англоязычных сообществах темы часто завалены короткими, малоценными ответами, такими как:
- «Спасибо / классно / хороший пост»
- «Согласен»
- «Следую»
- «Вверх»
- общие комплименты без новой информации
Такие ответы создают шум, увеличивают необходимость прокрутки и ухудшают опыт чтения для всех — особенно в длинных ветках.
Модераторы могут бороться с этим с помощью правил и ручных действий, но это плохо масштабируется. А фильтрация исключительно на основе регулярных выражений часто приводит к высокому уровню ложных срабатываний.
Что я создал / текущий прототип
Сейчас я экспериментирую с подходом, похожим на плагин:
- Предварительная фильтрация через регулярные выражения для отлова самых очевидных коротких / уклончивых ответов.
- Затем оставшиеся кандидаты передаются LLM для классификации.
- Интерфейс должен быть прозрачным: показывать сколько ответов было скрыто.
- Скрытые ответы должны быть доступны по запросу («Показать скрытые ответы»).
- (Опционально) Для скрытого контента запустить дополнительный шаг LLM, чтобы извлечь 2–3 репрезентативных предложения из скрытых ответов, чтобы читатели могли быстро увидеть, «что было скрыто», не раскрывая всё.
Даже только с регулярными выражениями опыт чтения значительно улучшается (меньше прокрутки), но уровень ложных срабатываний слишком высок — поэтому я считаю, что суждение на основе LLM необходимо.
Предлагаемое поведение продукта (для пользователей)
Внутри каждой темы читатели увидят что-то вроде:
- «12 ответов скрыто (Фильтр низкокачественного контента: Средний)»
- Кнопки: Показать скрытые ответы / Изменить уровень фильтрации
И предоставлять несколько уровней, например:
- Выкл: показывать всё
- Низкий: скрывать очевидный мусор (очень высокая точность)
- Средний: скрывать распространённые низкокачественные ответы
- Высокий: агрессивная фильтрация (по желанию пользователя)
Важно:
- Это должно быть настройкой для каждого пользователя (и, возможно, также настраиваемым по умолчанию для каждой категории/сайта).
- Система должна оставаться прозрачной и обратимой: ничего не «удаляется», а лишь скрывается по умолчанию.
Почему это подходит для Discourse (особенно сейчас)
В Discourse уже есть несколько функций, связанных с ИИ, и экосистема Discourse AI растёт. Я считаю, что «очиститель» ответов внутри тем — это одно из самых практичных и высокоэффективных применений LLM для UX сообщества.
Это не совсем «обнаружение спама» (которое обычно происходит на уровне аккаунта). Здесь речь идёт скорее о качестве чтения на уровне темы.
Вопросы для разработчиков / сообщества
- Есть ли у Discourse уже планы по фильтру качества ответов / низкокачественного контента?
- Имеет ли смысл разрабатывать это как расширение Discourse AI или как отдельный плагин?
- Какой лучший способ реализовать UI/UX, чтобы он был прозрачным и не путал пользователей?
- Есть ли какие-либо опасения относительно политики модерации, уровней доверия или пограничных случаев (например, короткие, но ценные ответы вроде «Решено», «+1 со ссылкой» и т. д.)?
Если это направление имеет смысл, я с радостью предоставлю больше деталей (правила регулярных выражений, макеты интерфейса, идеи для промптов) и, возможно, займусь PR/плагином.
Спасибо!