Предложение функции: фильтр «бессмысленных ответов» на базе ИИ с настраиваемыми уровнями

Всем привет,

Я хотел бы предложить фильтр с поддержкой ИИ для низкокачественных / бессмысленных ответов («водные ответы», шаблонные спам-комментарии) внутри тем.

Проблема

Во многих англоязычных сообществах темы часто завалены короткими, малоценными ответами, такими как:

  • «Спасибо / классно / хороший пост»
  • «Согласен»
  • «Следую»
  • «Вверх»
  • общие комплименты без новой информации

Такие ответы создают шум, увеличивают необходимость прокрутки и ухудшают опыт чтения для всех — особенно в длинных ветках.

Модераторы могут бороться с этим с помощью правил и ручных действий, но это плохо масштабируется. А фильтрация исключительно на основе регулярных выражений часто приводит к высокому уровню ложных срабатываний.

Что я создал / текущий прототип

Сейчас я экспериментирую с подходом, похожим на плагин:

  1. Предварительная фильтрация через регулярные выражения для отлова самых очевидных коротких / уклончивых ответов.
  2. Затем оставшиеся кандидаты передаются LLM для классификации.
  3. Интерфейс должен быть прозрачным: показывать сколько ответов было скрыто.
  4. Скрытые ответы должны быть доступны по запросу («Показать скрытые ответы»).
  5. (Опционально) Для скрытого контента запустить дополнительный шаг LLM, чтобы извлечь 2–3 репрезентативных предложения из скрытых ответов, чтобы читатели могли быстро увидеть, «что было скрыто», не раскрывая всё.

Даже только с регулярными выражениями опыт чтения значительно улучшается (меньше прокрутки), но уровень ложных срабатываний слишком высок — поэтому я считаю, что суждение на основе LLM необходимо.

Предлагаемое поведение продукта (для пользователей)

Внутри каждой темы читатели увидят что-то вроде:

  • «12 ответов скрыто (Фильтр низкокачественного контента: Средний)»
  • Кнопки: Показать скрытые ответы / Изменить уровень фильтрации

И предоставлять несколько уровней, например:

  • Выкл: показывать всё
  • Низкий: скрывать очевидный мусор (очень высокая точность)
  • Средний: скрывать распространённые низкокачественные ответы
  • Высокий: агрессивная фильтрация (по желанию пользователя)

Важно:

  • Это должно быть настройкой для каждого пользователя (и, возможно, также настраиваемым по умолчанию для каждой категории/сайта).
  • Система должна оставаться прозрачной и обратимой: ничего не «удаляется», а лишь скрывается по умолчанию.

Почему это подходит для Discourse (особенно сейчас)

В Discourse уже есть несколько функций, связанных с ИИ, и экосистема Discourse AI растёт. Я считаю, что «очиститель» ответов внутри тем — это одно из самых практичных и высокоэффективных применений LLM для UX сообщества.

Это не совсем «обнаружение спама» (которое обычно происходит на уровне аккаунта). Здесь речь идёт скорее о качестве чтения на уровне темы.

Вопросы для разработчиков / сообщества

  1. Есть ли у Discourse уже планы по фильтру качества ответов / низкокачественного контента?
  2. Имеет ли смысл разрабатывать это как расширение Discourse AI или как отдельный плагин?
  3. Какой лучший способ реализовать UI/UX, чтобы он был прозрачным и не путал пользователей?
  4. Есть ли какие-либо опасения относительно политики модерации, уровней доверия или пограничных случаев (например, короткие, но ценные ответы вроде «Решено», «+1 со ссылкой» и т. д.)?

Если это направление имеет смысл, я с радостью предоставлю больше деталей (правила регулярных выражений, макеты интерфейса, идеи для промптов) и, возможно, займусь PR/плагином.

Спасибо!


3 лайка