Что дальше для обнаружения токсичности в Discourse AI

Сегодня мы объявляем о завершении работы модуля Discourse AI - Toxicity :waving_hand: в пользу Discourse AI - AI triage, который использует мощь больших языковых моделей (LLM) для обеспечения превосходного пользовательского опыта.

Почему мы это делаем?

Ранее использование модуля Toxicity означало, что:

  • Вы были ограничены одной предопределённой моделью
  • Не было возможности настройки под специфические нужды вашего сообщества
  • Пороговые метрики были запутанными
  • Производительность оставляла желать лучшего

Большие языковые модели значительно продвинулись вперёд и теперь способны обеспечить более высокую производительность и гибкость настройки.

Что нового?

Discourse AI - AI triage можно использовать для сортировки сообщений по признаку токсичности (среди прочего) и обеспечения соблюдения сообществом правил поведения. Это означает, что теперь доступны:

  • Поддержка нескольких LLM для различных требований к производительности
  • Простая настройка того, как и какой контент должен обрабатываться
  • Настраиваемые промпты под специфические нужды сообщества
  • Флагирование контента для ручной проверки

и многое другое.

Чтобы помочь вам с переходом, мы уже подготовили руководства:

Что происходит с модулем Toxicity?

Это объявление следует считать очень ранним. До момента официального вывода модуля из эксплуатации вы можете продолжать использовать Toxicity. Когда это произойдёт, модуль будет удалён, а весь связанный код — из плагина Discourse AI и соответствующих сервисов на наших серверах.

:backhand_index_pointing_right:t5: Обновление: Модуль Toxicity теперь официально удалён из Discourse, включая все связанные настройки сайта и функции. Мы настоятельно рекомендуем пользователям перейти на использование Discourse AI - AI triage и следовать приведённым выше руководствам.

Клиенты бизнес- и корпоративного уровней увидят следующее в разделе «Что нового» в настройках администратора на своих сайтах, что позволит им бесплатно включить размещённые на платформе Discourse LLM для работы функции AI triage.

6 лайков

Есть ли предельная дата для модуля «Токсичность»?

3 лайка

Мы ещё не выбрали конкретную дату, но в настоящее время работаем над тем, чтобы завершить это в ближайшее время.

3 лайка

Это крайне актуально для статьи, которую я сейчас пишу для Института лидеров сообществ, для моей диссертации по токсичности и другим темам. Не могли бы вы дать эксклюзивное интервью о этой системе для моего YouTube-канала в рамках моей серии материалов о защите онлайн-сообществ от токсичности? Это также будет частью моего академического исследования для диссертации.

Вы готовы к этому?

2 лайка

Спасибо, что подумали о Discourse для вашего канала на YouTube! Не могли бы вы отправить более подробную информацию на адрес mae@discourse.org о том, что именно будет включать в себя интервью за кулисами и что потребуется с нашей стороны?

2 лайка

К сведению о следующем изменении

2 лайка

Спасибо, Мэй! Я связался!

1 лайк

Предупреждаем: мы сейчас скрываем настройки сайта для включения/отключения токсичности и контента для взрослых (NSFW). Это часть наших текущих усилий по постепенному отказу от этих функций.

Если у вас эти функции включены, они продолжат работать как обычно. Мы пока полностью не отказались от них.

Если у вас они отключены и вы хотите их включить, теперь вы не сможете этого сделать.

1 лайк

Привет, ребята, просто хотел сообщить об этом обновлении

1 лайк