Плагин API модерации

:information_source: Резюме Плагин Discourse Moderation API расширяет возможности вашего форума Discourse, добавляя автоматизированные функции модерации. Использует проверенный движок обнаружения Moderation API и включает улучшенную панель модерации, повышающую эффективность модераторов в 10 раз.
:hammer_and_wrench: Ссылка на репозиторий https://github.com/moderation-api/discourse-moderation-api
:open_book: Руководство по установке Как установить плагины в Discourse

:hammer_and_wrench: Ключевые возможности

Moderation API — это комплексное решение для модерации полного цикла.

Автоматизированные действия модерации

  • Автоматическая пометка комментариев и тем.
  • Выбор из более чем 20 готовых моделей для типовых сценариев или создание собственных.
  • Обнаружение токсичности, контента 18+, персональной информации (PII), спама, самопиара, незаконной деятельности и многого другого.
  • Настройка пользовательских порогов для автоматической пометки.

Обнаружение на базе LLM

  • Интеграция правил вашего сообщества в AI-агента.
  • Использование ИИ в качестве первой линии защиты или надежного модератора для пометки комментариев.

Обучение пользовательских моделей

  • Разработка собственных моделей ИИ для достижения максимальной точности модерации.
  • Использование действий модераторов в качестве обратной связи для обучения и уточнения моделей.
  • Постоянное улучшение автоматической пометки с помощью машинного обучения.

Улучшенная очередь проверки

  • Опциональное использование очереди проверки Moderation API для более удобного и современного процесса модерации.
  • Создание нескольких очередей проверки, адаптированных под разные языки, категории или конкретные цели.
  • Разработка рабочих процессов модерации для эскалации контента.
  • Назначение модераторов на конкретные очереди проверки для эффективного управления.

Аналитика в панели управления

  • Мониторинг активности ИИ и результатов через панель Moderation API.
  • Получение информации о распространенных проблемах и выявление областей для улучшения.

Бесшовная интеграция

  • Легкая интеграция с существующими рабочими процессами и ролями пользователей в Discourse.
  • Выбор между очередью проверки Discourse или очередью проверки Moderation API.
  • Использование встроенных действий модерации из Discourse.

:rocket: Конфигурация

Следуйте этим шагам для настройки плагина Moderation API:

Создание проекта в Moderation API

  • Перейдите в панель управления Moderation API.
  • Создайте новый проект и выберите метки, которые вы хотите обнаруживать.

(Опционально) Тестирование и настройка порогов

  • Используйте ползунки порогов для определения строгости модерации.
  • Протестируйте ответ API в песочнице.

Настройка API-ключа

  • Найдите свой API-ключ в разделе “Интеграция” на панели управления проекта.
  • В панели администратора Discourse перейдите в Настройки > Moderation API.
  • Вставьте свой API-ключ в поле “Ключ Moderation API”.
  • Сохраните изменения.

Включение плагина

  • Выберите поведение при пометке (см. варианты ниже). Вы можете начать с варианта “ничего”, чтобы протестировать плагин без выполнения каких-либо действий.
  • Нажмите “Включить плагин”, чтобы начать анализ новых сообщений. Плагин не анализирует уже существующий контент.

(Опционально) Добавление правил вашего сообщества

  • Перейдите в Model Studio в Moderation API.
  • Создайте нового AI-агента.
  • Включите ваши правила в качестве инструкций для агента. Если у вас обширные правила, рассмотрите возможность создания нескольких агентов.
  • Добавьте агента в свой проект.


:triangular_flag: Поведение при пометке

Плагин предлагает четыре варианта поведения при пометке, определяющие действия, предпринимаемые, когда Moderation API помечает комментарий.

1. Пометить (Поведение по умолчанию)

Бот плагина добавляет метку “Неуместно” к комментарию в соответствии с вашей конфигурацией Discourse. Обычно это означает, что комментарий появляется в очереди проверки, но может не скрываться сразу, пока модератор не одобрит его или пока другие пользователи не пометят его дополнительно. Проверьте настройки, связанные с пометками, в Discourse для кастомизации.

2. В очередь на проверку

Комментарий мгновенно скрывается и добавляется в очередь проверки для одобрения или отклонения модераторами.

3. Блокировать сообщение

Комментарий никогда не публикуется. Автор получает сообщение об ошибке, указывающее, что комментарий был заблокирован автоматизированной системой модерации. (Вы можете настроить сообщение об ошибке.)

4. Ничего

Никаких немедленных действий не предпринимается. Комментарий анализируется и, если он помечен, появится в панели Moderation API. Этот вариант полезен для тестирования Moderation API перед полным включением плагина.


:white_check_mark: TODO

  • Включение действий из очереди проверки Moderation API для удаления контента из Discourse.
  • Синхронизация действий из очереди проверки Discourse с очередью проверки в Moderation API.
  • Разрешение отдельных проектов модерации для разных категорий.
  • Пометка контента с использованием выбранной категории пометки Discourse (в настоящее время используется “Неуместно”).

:wrench: Настройки

Ниже приведена таблица доступных настроек для плагина Moderation API с их описаниями:

Настройка Описание
Включить Moderation API Контролирует, активен ли плагин.
По умолчанию: Отключено
Поведение при пометке Что происходит, когда контент помечается:
• В очередь на проверку
• Пометить сообщение
• Блокировать сообщение
• Ничего
По умолчанию: Пометить сообщение
Сообщение о блокировке Сообщение, отображаемое пользователям при блокировке их сообщения.
По умолчанию: “Ваше сообщение было заблокировано нашей системой модерации.”
Уведомлять об очереди сообщений Отправлять уведомления, когда сообщения помещаются в очередь на проверку.
По умолчанию: Включено
Проверять личные сообщения Применять модерацию к личным сообщениям.
По умолчанию: Отключено
Исключить группы Группы пользователей, которые обходят проверки модерации.
По умолчанию: Нет
Исключить категории Категории форума, которые обходят проверки модерации.
По умолчанию: Нет
API-ключ Ваш ключ аутентификации Moderation API.
По умолчанию: Нет

:credit_card: Подписки

Вы можете установить плагин немедленно и воспользоваться нашим бесплатным тарифом или 30-дневным пробным периодом. Для расширенных функций и более высоких лимитов использования изучите наши варианты подписки.


:books: Документация


:hammer_and_wrench: Поддержка



Отказ от ответственности: Хотя плагин Discourse Moderation API значительно расширяет возможности модерации, важно изучить и понять последствия автоматизированной модерации. Всегда обеспечивайте прозрачность для вашего сообщества в отношении использования ИИ в процессах модерации.

Примечание о конфиденциальности: Этот плагин обрабатывает созданный пользователями контент для соблюдения правил модерации. Убедитесь в соответствии вашим политикам конфиденциальности и проинформируйте пользователей о практиках обработки данных.


10 лайков

Из README репозитория GitHub:

Вы можете сразу установить плагин и воспользоваться бесплатным тарифом или 30-дневной пробной версией.

Я не смог найти информацию о бесплатном тарифе на сайте или в документации к API. Каковы его ограничения?

Также, доступен ли план с оплатой по факту использования только после превышения квоты платного тарифа?

2 лайка

Бесплатный тариф доступен для хобби-проектов. Не стесняйтесь отправить сообщение, чтобы настроить его.

Верно, PAYG (оплата по факту использования) включается по желанию для платных тарифов при превышении включённой квоты.

3 лайка

Рады видеть больше инструментов модерации на базе ИИ! Не могли бы вы уточнить, что именно это добавляет по сравнению с автоматической сортировкой Discourse AI? Спасибо!

1 лайк

Да, конечно. В оригинальном посте, вероятно, это можно было бы сформулировать яснее.

Сначала отмечу, что Moderation API даёт доступ к полноценной платформе модерации, где движок обнаружения — лишь одна из её частей. По сути, вы становитесь партнёром компании, имеющей многолетний опыт решения задач контентной модерации.

Но если сосредоточиться только на обнаружении/триажировании:

  1. Высокая точность: Вы можете выбрать из более чем 20 готовых классификаторов для решения наиболее распространённых задач. Это значительно упрощает старт, а мы постоянно совершенствуем наши модели, так что вам не нужно беспокоиться о последних новинках.
    Обычно хорошо обученный классификатор даёт более точные и надёжные результаты по сравнению с LLM, настроенной через промпты.

  2. Осведомлённость о контексте: Движок обнаружения Moderation API также анализирует предыдущие сообщения в теме и историю автора, что позволяет проводить более качественный анализ. На мой взгляд, это существенное улучшение по сравнению с встроенным триажированием.

  3. Специализированные LLM: Я считаю, что в Discourse вы можете выбрать между несколькими моделями, такими как gpt-4o и claude, тогда как Moderation API также поддерживает LLM, специально обученные для контентной модерации, например Llama-guard, и в будущем появятся ещё. Наши LLM уже предварительно настроены с промптами для максимальной эффективности на основе наших данных.

  4. Обучение собственных моделей: Как только вы подключитесь к Moderation API, у вас появится возможность обучать собственные модели на ваших специфических данных.

  5. Соответствие требованиям: Мы размещаем наши модели на собственных серверах и можем предоставлять индивидуальные соглашения об обработке данных (DPA) для компаний, для которых приоритетны соответствие и регулирование. В некоторых случаях мы даже можем предложить решения on-premise.

  6. Стоимость: Лучшая часть заключается в том, что при больших объёмах мы можем предложить более низкие цены, а в любом случае предоставляем фиксированные ставки для предсказуемости затрат.

Надеюсь, теперь стало понятнее. Настройка проекта предоставляет множество опций и гибкости по сравнению с простым написанием промпта, поэтому я бы сказал, что это гораздо более мощное и специализированное решение.

2 лайка

При установке плагина и повторной сборке приложения возникает следующая ошибка:

Gem::LoadError: невозможно активировать faraday-2.12.2, так как уже активирована faraday-2.13.4
… /plugins/discourse-moderation-api/plugin.rb:11:in `activate!’

Полные логи: er-js/faker-10.0.0 * [new branch] dependabot/npm_and_yarn/fortawesome - Pastebin.com

Даниэль, спасибо за попытку использования плагина.

Я сейчас занимаюсь этим вопросом. Тем временем будет немного проще помочь, если вы напишете в службу поддержки по адресу support@moderationapi.com

Это должно быть исправлено в последней версии плагина. Думаю, вы теперь можете просто пересобрать своё приложение.