Обеспокоенность личной конфиденциальностью с плагином AI

#feature-request
Уважаемые разработчики Discourse,

Спасибо за запуск плагина AI. Мы используем его в нашем форуме сообщества, где обмениваемся мнениями, а также лучшими практиками нашей работы.

У нас есть опасения относительно права на личную неприкосновенность здесь, в Европе. По правилам нашего форума мы используем имена как имена пользователей. Запросы с плагином AI отправляют имя вместе с содержимым поста сторонним сервисам в других странах и регионах (OpenAI, Meta, Claude и т. д.). Это огромная проблема для нас при использовании плагина, так как это связывает контент с конкретными людьми.

Поэтому мы надеемся на дополнительную функцию конфиденциальности для отключения всех видов передачи персональных данных.

Будем рады получить от вас ответ.

С наилучшими пожеланиями,
Вольфганг

2 лайка

Это осознанный выбор владельцев сайта.

Discourse AI с самого начала разрабатывался как нейтральная система по отношению к поставщикам ИИ, поэтому администраторы могут выбрать поставщика ИИ, которому они доверяют в плане обработки данных, который соблюдает любые региональные ограничения, или даже разместить модели ИИ на том же оборудовании, где работает форум, чтобы данные никогда не передавались третьим сторонам.

9 лайков

Пост был разделён на новую тему: Как внедрить Mistral с эмбеддингами

Привет, Фалько,

Не мог бы ты дать мне указания или подсказать, как изменить эту настройку?

Также этот пост очень хорошо описывает то, что я имею в виду:

Это делается так же, как вы изначально настраивали свою LLM: перейдите в Администрирование > Плагины > ИИ > LLM и зарегистрируйте там выбранную вами LLM.

2 лайка

Понял, спасибо. Но, думаю, здесь недопонимание. Суть в том, что я хочу иметь возможность выбирать, отправляется ли имя пользователя в LLM — неважно, в какой именно. Эта настройка тоже работает так, как вы описали выше?

2 лайка

Нет, настройки сайта для этого не существует, и в данный момент это не планируется.

В качестве обходного пути для сотрудников, которым требуются более строгие правила в отношении обмена данными с третьими сторонами, мы предлагаем совместимость практически со всеми размещёнными и локальными языковыми моделями (LLM), что решает проблему, подходя к ней с другой стороны.

Я считаю, что было бы довольно неполноценной функцией для нас предлагать операторам сайтов ложное чувство безопасности.

Если имена пользователей считаются ПДн (PII)… то что насчет огромного множества способов, которыми эти ПДн просачиваются в сообщения?

  • цитаты
  • упоминания
  • или просто случайное упоминание Джейн Остин?
4 лайка

Ладно, справедливое замечание. Я об этом не подумал.
Так что, получается, всё сводится к тому, доверяем ли мы той или иной большой языковой модели (LLM)? Если мы не доверяем ни одной LLM и не можем позволить себе разместить свою собственную, значит, мы не можем использовать эту функцию/плагин?

2 лайка

Как ещё можно обеспечить конфиденциальность, если даже беглое упоминание или цитата могут раскрыть идентифицирующую информацию?

Точно! Если вы одновременно:

  • Не доверяете никаким сторонним LLM
  • Не хотите запускать собственную LLM

Я рекомендую не интегрировать LLM в ваш форум.

5 лайков