J’utilise Discourse AI sur mon site, qui fonctionne sur un sous-domaine (community.website.com), et j’aimerais mieux comprendre quelles informations utilisateur pourraient être partagées avec le modèle linguistique (LLM) lors des interactions. Plus précisément, je suis curieux de savoir :
Quels types de données utilisateur (par exemple, informations personnelles, adresses IP) pourraient potentiellement être exposés au LLM ?
Existe-t-il des mesures de sécurité en place au sein de Discourse AI pour limiter ou anonymiser ce qui est envoyé ?
Pour un contexte supplémentaire, ma configuration utilise Caddy comme proxy inverse et Sucuri pour le DNS et le pare-feu. Si quelqu’un a des éclaircissements sur la façon dont cette configuration pourrait affecter ce qui est exposé — ou des connaissances générales sur la façon dont Discourse AI gère les données utilisateur — j’apprécierais vraiment vos commentaires !
J’ai hâte d’entendre ceux qui ont une meilleure compréhension de ce sujet.
Je pense que vous avez utilisé mes plugins d’IA à un moment donné, Chatbot et AI Topic Summary, puisque vous avez posté dans ces sujets, je vais donc répondre pour ceux-ci, mais si vous souhaitez plus d’informations, veuillez poster dans ces sujets.
Mes deux plugins envoient les noms d’utilisateur et le contenu brut des messages (c’est-à-dire le markdown). NB si quelqu’un mentionne le nom de quelqu’un dans un message, ou une adresse, cela sera envoyé dans le markdown, bien sûr, mais sinon les utilisateurs ne sont représentés que par des noms d’utilisateur.
D’autres métadonnées ne sont pas envoyées, par exemple les adresses IP, les profils d’utilisateurs, etc.
Vous pouvez voir les requêtes envoyées dans les journaux si vous sélectionnez l’option de journalisation détaillée et redirigez les journaux vers Avertissement (il existe un autre paramètre) afin qu’ils soient visibles dans /logs.
Merci Robert. Oui, j’utilise ces plugins qui sont excellents. J’apprécie vos commentaires. Après avoir lu certaines des politiques de confidentialité des LLM, le transfert de données sensibles pour les utilisateurs serait préoccupant. Évidemment, quel que soit le contexte de la conversation, il sera envoyé et le nom d’utilisateur en soi n’est pas vraiment préoccupant. Certains des termes des LLM sont assez envahissants, c’est donc ce qui a motivé ma demande. Merci encore.
C’est bien qu’il ne s’agisse que de noms d’utilisateurs et de contenu de publication. Tant qu’il ne s’agit que de contenu visible publiquement, alors vraiment, cela ne fait aucune différence si c’est un moteur de recherche, une IA ou un humain qui a vu du contenu et l’a diffusé ou en a dérivé quelque chose.
Je serais préoccupé par les publications/catégories privées réservées à certains utilisateurs connectés. Si des discussions commerciales sensibles ont lieu et que ces informations parviennent à une IA, alors l’IA pourra présenter ces idées à toute autre personne qui pourrait demander des idées commerciales. Ou similaire.
Mon site est destiné à un projet open source, donc plus de données sont envoyées pour que les IA apprennent, mieux c’est pour aider tout le monde.