Discourse AIのLLMにさらされるユーザー情報とは

Discourse AI をサイト(サブドメイン community.website.com で実行)で使用しており、対話中に言語モデル(LLM)と共有される可能性のあるユーザー情報について、より深く理解したいと考えています。具体的には、以下の点について知りたいです。

  1. どのような種類のユーザーデータ(個人情報、IPアドレスなど)が LLM に公開される可能性がありますか?
  2. Discourse AI には、送信される情報を制限または匿名化するための安全策はありますか?

追加情報として、私のセットアップでは Caddy をリバースプロキシとして、Sucuri を DNS およびファイアウォールとして使用しています。この構成が公開される情報にどのように影響する可能性があるか、または Discourse AI がユーザーデータをどのように処理するかについての一般的な知識があれば、ぜひご意見をお聞かせください。

この件についてより理解されている方からのご意見をお待ちしております。

「いいね!」 1

私のAIプラグイン、ChatbotAI Topic Summary をいつか使用されたことがあると信じていますが、それらのトピックに投稿されたことがあるため、それらについて回答します。ただし、さらに詳しい情報が必要な場合は、それらのトピックに投稿してください。

私の両方のプラグインは、ユーザー名と**生の投稿コンテンツ(つまりMarkdown)**を送信します。投稿で誰かの名前や住所に言及した場合、もちろんそれもMarkdownで送信されますが、それ以外の場合、ユーザーはユーザー名によってのみ表されます。

IPアドレスやユーザープロフィールなどのその他のメタデータは送信されません。

詳細ログのオプションを選択し、ログをWarnにリダイレクト(別の設定があります)すると、/logsで表示されるクエリを確認できます。

「いいね!」 4

ロバートさん、ありがとうございます。はい、それらの優れたプラグインを使用しています。フィードバックに感謝します。LLMのプライバシーポリシーをいくつか読んだ後では、ユーザーの機密データを転送することは懸念事項となります。明らかに、チャット内のコンテキストは何であれ送信され、ユーザー名自体はそれほど懸念事項ではありません。LLMの利用規約の中には非常に侵襲的なものもあるため、それが私の問い合わせのきっかけとなりました。重ねて感謝いたします。

「いいね!」 2

それがユーザー名と投稿内容だけなら良いことです。公開されているコンテンツに限定される限り、検索エンジン、AI、または人間がコンテンツを見てそれを広めたり、そこから何かを導き出したりしても、実際には違いはありません。

ログインユーザー限定のプライベートな投稿やカテゴリについては懸念があります。機密性の高いビジネス上の議論が行われており、その内容がAIに渡された場合、AIはそのアイデアをビジネスアイデアを求める他の人に提示できるようになります。あるいは同様に。

私のサイトはオープンソースプロジェクト用なので、AIが学習するために送信されるデータが多いほど、すべての人を助けるのに役立ちます。