Welche Benutzerdaten werden in Discourse AI für LLMs offengelegt

Ich nutze Discourse AI auf meiner Website, die auf einer Subdomain (community.website.com) läuft, und möchte besser verstehen, welche Art von Benutzerinformationen während der Interaktionen möglicherweise an das Sprachmodell (LLM) weitergegeben werden. Insbesondere interessiert mich:\n\n1. Welche Arten von Benutzerdaten (z. B. persönliche Informationen, IP-Adressen) könnten potenziell dem LLM ausgesetzt sein?\n2. Gibt es innerhalb von Discourse AI Schutzmaßnahmen, um das, was gesendet wird, einzuschränken oder zu anonymisieren?\n\nAls zusätzlichen Kontext verwende ich Caddy als Reverse-Proxy und Sucuri für DNS und Firewall. Wenn jemand Einblicke hat, wie diese Konfiguration beeinflussen könnte, was preisgegeben wird – oder allgemeine Kenntnisse darüber, wie Discourse AI Benutzerdaten verarbeitet – würde ich mich sehr über Input freuen!\n\nIch freue mich darauf, von denen zu hören, die hier ein besseres Verständnis haben.

1 „Gefällt mir“

Ich glaube, Sie haben meine KI-Plugins zu einem bestimmten Zeitpunkt verwendet, Chatbot und AI Topic Summary, da Sie in diesen Themen gepostet haben. Daher werde ich für diese antworten, aber wenn Sie weitere Informationen wünschen, posten Sie bitte in diesen Themen.

Beide meiner Plugins senden Benutzernamen und rohen Post-Inhalt (d. h. den Markdown). Hinweis: Wenn jemand den Namen eines Benutzers oder eine Adresse in einem Beitrag erwähnt, wird dies natürlich im Markdown gesendet, aber ansonsten werden Benutzer nur durch Benutzernamen dargestellt.

Andere Metadaten werden nicht gesendet, z. B. IPs, Benutzerprofile usw.

Sie können die gesendeten Abfragen in den Protokollen sehen, wenn Sie die Option für ausführliche Protokollierung auswählen und die Protokolle auf Warnung umleiten (es gibt eine weitere Einstellung), sodass sie in /logs sichtbar sind.

4 „Gefällt mir“

Danke Robert. Ja, ich benutze diese Plugins, die ausgezeichnet sind. Ich schätze das Feedback. Nach dem Lesen einiger Datenschutzrichtlinien für LLMs wäre die Übertragung sensibler Daten für Benutzer besorgniserregend. Offensichtlich wird der Kontext innerhalb des Chats gesendet und der Benutzername allein ist wirklich nicht besorgniserregend. Einige der LLM-Bedingungen sind ziemlich invasiv, daher rührte meine Anfrage. Nochmals vielen Dank.

2 „Gefällt mir“

Das ist gut, es sind nur Benutzernamen und Post-Inhalte. Solange es sich nur um öffentlich sichtbare Inhalte handelt, macht es wirklich keinen Unterschied, ob eine Suchmaschine, eine KI oder ein Mensch Inhalte gesehen und verbreitet oder daraus etwas abgeleitet hat.

Ich wäre besorgt über private Beiträge/Kategorien, die für bestimmte eingeloggte Benutzer bestimmt sind. Wenn sensible Geschäftsdiskussionen stattfinden und diese Dinge an eine KI gehen, kann die KI diese Ideen nun jedem anderen präsentieren, der nach Geschäftsideen fragt. Oder ähnliches.

Meine Website ist für ein Open-Source-Projekt, daher gilt: Je mehr Daten an KIs gesendet werden, um daraus zu lernen, desto besser ist es, allen zu helfen.