Discourse AI — Токсичность

:bookmark: Эта тема посвящена настройке функции «Токсичность» плагина Discourse AI.

:person_raising_hand: Требуемый уровень доступа: Администратор

Модули «Токсичность» могут автоматически определять уровень токсичности каждого нового сообщения в теме и в чате на вашем экземпляре Discourse. Также можно включить автоматическую пометку контента, превышающего установленный порог.

Результаты классификации сохраняются в базе данных, поэтому вы можете сразу же включить плагин и использовать Data Explorer для формирования отчётов о классификации нового контента в Discourse. В ближайшее время мы добавим несколько стандартных запросов для Data Explorer в состав плагина, чтобы упростить эту задачу.

Настройки

  • ai_toxicity_enabled: Включает или отключает модуль.

  • ai_toxicity_inference_service_api_endpoint: URL-адрес, где работает API для модуля токсичности. Если вы используете хостинг от CDCK, это настраивается автоматически. Если вы размещаете Discourse самостоятельно, ознакомьтесь с руководством по самостоятельному размещению.

  • ai_toxicity_inference_service_api_key: Ключ API для настроенного выше API токсичности. Если вы используете хостинг от CDCK, это настраивается автоматически. Если вы размещаете Discourse самостоятельно, ознакомьтесь с руководством по самостоятельному размещению.

  • ai_toxicity_inference_service_api_model: Мы предлагаем три различные модели: original, unbiased и multilingual. Рекомендуется использовать модель unbiased вместо original, так как она стремится не переносить предвзятости, заложенные в обучающих данных, в процесс классификации. Для многоязычных сообществ последняя модель поддерживает итальянский, французский, русский, португальский, испанский и турецкий языки.

  • ai_toxicity_flag_automatically: Автоматически помечать сообщения в темах или чате, если классификация по конкретной категории превышает установленный порог. Доступные категории: toxicity, severe_toxicity, obscene, identity_attack, insult, threat и sexual_explicit. Для каждой категории существует отдельная настройка ai_toxicity_flag_threshold_${category}.

  • ai_toxicity_groups_bypass: Пользователи, состоящие в указанных группах, не будут подвергаться классификации их сообщений модулем токсичности. По умолчанию сюда входят сотрудники (staff).

Дополнительные ресурсы

10 лайков