Foren, die KI-Inhalte verbieten… Wie läuft das?

one1 · 19. Juni 2026 um 03:00

Ich würde gerne die Erfahrungen von Forenmitarbeitenden hören, die KI/LLM-generierte Inhalte nicht erlauben. Wie habt ihr das den Nutzern vermittelt? Wie erkennt ihr solche Beiträge? Wie geht ihr mit Nutzern um, die dennoch solche Inhalte posten?

Jede Meinung ist willkommen.

Hinweis: Mich persönlich interessiert ausschließlich die menschliche Seite der Interaktionen auf der Website. Ich gehe davon aus, dass das Blockieren von Crawlern aussichtslos ist.

Unser Forum ist ein spirituelles/religiöses Diskussionsforum. Wir sperren jegliche KI-generierten Inhalte.

darkpixlz · 19. Juni 2026 um 04:43

Die meisten, wenn nicht sogar alle KI-Texte lassen sich leicht erkennen, indem man sie einfach liest. Googles SynthID ist eine coole Technologie zur Erkennung von KI-Bildern, und sie behauptet, sogar Texte erkennen zu können, die wahrscheinlich nur von Gemini geschrieben wurden. Allerdings unterstützt auch OpenAI den Standard. Die Fähigkeit, Texte persönlich zu erkennen, ist wahrscheinlich eine erlernte Fähigkeit, aber ich schätze die Arbeit, die geleistet wird, um auf die aktuelle Krise zu reagieren, in der wir uns befinden: wir können KI-Bilder oder -Texte nicht erkennen.

Stummschalten/Sperren sind meiner Meinung nach immer noch der richtige Weg, besonders wenn das Konto neu ist. Wenn ein zufälliges neues Konto deine Website betritt und sofort ein KI-generiertes Thema postet, sehe ich keinen Grund, warum du das Konto nicht einfach sperren und blockieren solltest.

Was das gesamte Scraping-Dilemma betrifft: Meine Website dient derzeit der internen Kommunikation und Dokumentation innerhalb eines kleinen Unternehmens, und ich plane, sie irgendwann als Backend für Blogging zu nutzen. Es war nicht schwer, eine Canytrap zu installieren, um die Crawler abzuhalten, die sich entscheiden, die robotstxt-Dateien auf meinen Domains zu ignorieren.

Nur diese eine Taktik hat im Laufe von zwei Wochen zu etwa 6 MILLIONEN Anfragen geführt (etwa 6 Anfragen/s an die Domain):

Wenn ein KI-Crawler diese Website besucht, wird er in ein endloses Labyrinth aus Spam geleitet, mit Hilfe des schönen iocaine Projekts, das selbst gehostet wird und einen Datensatz von etwa ~7000 erfundenen Wörtern, einigen Kauderwelsch-HTML, zufälligen Wörtern und gefälschten Nachrichten, die von 8B Llama erstellt wurden, enthält.

Offensichtlich ist dies eine nukleare „Geh weg“-Taktik und nicht für jeden geeignet, aber sie hat mir bei meinem Ziel, LLMs davon abzuhalten, meinen Code oder Textinhalt zu nehmen, sehr gut geholfen. Ich erinnere mich, eine Fallstudie gelesen zu haben, die Anthropic über LLM-Vergiftung gemacht hat, aber ich kann den Artikel nicht mehr finden, also wird er hier nicht angehängt, aber irgendwann müssen sie meine Domain blockieren, wenn sie erkennen, dass der Bot etwa 5 Millionen Anfragen an meine Domain gesendet hat, wie vor Kurzem.

Ed_S · 19. Juni 2026 um 08:24

(Ich merke, dass wir die Frage nach der Last durch Crawler, das Nutzen von Inhalten durch Crawler zum Training sowie die sozialen und wirtschaftlichen Folgen der aktuellen rasanten Entwicklungen beiseite lassen. Das ist gut.)

Für mich persönlich, auf einer Hobby-Seite mit geringer Frequenz:

Wir versuchen, eine schriftliche Richtlinie zu vereinbaren und zu formulieren.
Wir gehen mit den Problemen um, sobald sie auftauchen.
Die offensichtlichsten Fälle sind im Wesentlichen Spam, also löschen und sperren wir diese.
Andernfalls konfrontieren wir die Nutzer, vielleicht öffentlich, vielleicht privat, und wir können Beiträge löschen.

Eine vorgeschlagene Form der Anleitung könnte so aussehen:

Den Inhalt der von dir geposteten Nachrichten „eigen“ zu machen (d. h. sie zu lesen und zu verstehen und nicht blind Inhalte zu kopieren und einzufügen, unabhängig davon, woher sie stammen).
Zu versuchen, deine eigenen Fragen zunächst nach bestem Wissen und Gewissen zu beantworten (z. B. durch eine Suche im Forum), bevor du neue Threads erstellst.
Spezifische Informationen knapp und präzise zu kommunizieren, damit andere Nutzer sie lesen und verstehen und dir helfen können. Vermeide also lange Wände aus repetitiven oder irrelevanten Texten oder zu allgemeine Aussagen ohne ausreichende Informationen.
Diskussionen beim Thema zu halten und Meta-Diskussionen zu vermeiden (insbesondere rund um die Nutzung von KI – sei es „Best Practices“ oder „die Ethik dabei“).
Respektvolle Gespräche zu führen und daran zu denken, dass wir Nutzer mit unterschiedlichen Hintergründen, Ansichten und Meinungen haben.
Viel Spaß! Das soll ein Hobby sein.

(In unserer Hobby-Umgebung gibt es einen zusätzlichen Aspekt, nämlich die Nutzung von LLMs innerhalb des Hobbys, die ein Spektrum von Möglichkeiten abdeckt und sowohl Befürworter als auch Gegner hat.)

robbie.morrison · 26. Juni 2026 um 09:18

Dieses Beispiel betrifft zwar nicht Discourse, doch die damit verbundenen Fragen zu Politik und Governance würden sich zweifellos überschneiden.

Sowohl die englische als auch die deutsche Version von Wikipedia verfügen mittlerweile über das, was ich als extreme KI-Reinheitsrichtlinien bezeichnen würde. Als Redakteur mit 16 Jahren Erfahrung wurde mir fälschlicherweise vorgeworfen, KI-generierte Inhalte in einen Artikel eingefügt zu haben, den ich maßgeblich verfasst habe. Der Prozess, ein Abhilfeverfahren einzuleiten, war zermürbend. Dazu gehörte die Einreichung formaler Beschwerden beim ArbCom-Ausschuss der englischsprachigen Wikipedia und beim Trust and Safety Team der Wikimedia Foundation (WMF TST) – bisher wurden sie jeweils summarisch abgewiesen bzw. ohne Begründung zurückgewiesen.

Ich möchte meine Erfahrungen hier nicht im Einzelnen schildern, zum Teil, weil sie noch andauern. Ich ermutige die Leserinnen und Leser hier jedoch dringend, diesen außergewöhnlichen Austausch über den Wikipedia-EN-Artikel über Fern Cave zu lesen, eine Stätte von kultureller Bedeutung für das Modoc-Volk in Kalifornien:

https://en.wikipedia.org/wiki/User_talk:Gurkubondinn/Archives/2026#No_LLM_Mark_on_fern_caves.

Die betreffende Autorin musste viermal bestreiten, KI verwendet zu haben. Dabei wurde auch ihr indigenes Wissen abgewertet. Die durchsetzende Redakteurin schließt mit einer Bemerkung, die zwar besorgt klingt, aber gleichermaßen als verschleierte Drohung gedeutet werden kann, Sanktionen zu verhängen, falls sie nicht nachgibt.

Solche psychologischen Taktiken werden von durchsetzenden Redakteuren regelmäßig eingesetzt; ich verfüge zudem über Belege für weitere Beispiele.

Werden im Quellcode derselben Diskussion nachgeschaut, findet man eine „Honigtopf“-Falle mit font-size: 0pt, die dazu dienen sollte, die Nutzung von KI durch die beschuldigte Autorin beim Formulieren von Antworten aufzudecken. Diese Falle wurde nicht ausgelöst.

Es liegen glaubwürdige Berichte vor, wonach mehrere Redakteure die Wikipedia-DE verlassen haben, nachdem sie wegen angeblicher Nutzung von KI-Tools „ungerechtfertigt angegriffen“ wurden.

Um die ursprüngliche Frage dieses Threads zu beantworten: Ich bin der Auffassung, dass Wikipedia-EN und Wikipedia-DE bei ihrem Versuch, mit KI-Inhalten umzugehen, in mehrfacher Hinsicht bei der Governance kläglich versagen. Ich habe drei Fallstudien in meinem kürzlich erstellten 17-seitigen Bericht an das WMF TST-Team dokumentiert. Möglicherweise werde ich dieses PDF zu gegebener Zeit öffentlich zugänglich machen.

robbie.morrison · 26. Juni 2026 um 09:33

Ich bin aus meinen Erfahrungen auf Wikipedia EN (detailliert an anderer Stelle zu diesem Thema) stark anderer Meinung. Ich schlage vor, dass dieser Ansatz größtenteils Pseudowissenschaft mit Hochmut vermischt ist. Noch wichtiger ist, dass eine solche Erkennung nicht widerlegbar ist – und tatsächlich graben sich die durchsetzenden Editoren auf Wikipedia, oft im Zusammenspiel, bei Herausforderungen nur noch tiefer ein.

Der beschuldigte Editor bleibt mit einer umgekehrten Beweislast und Anschuldigungen zurück, die schlichtweg nicht widerlegbar sind – selbst bei den überzeugendsten Beweisen für das Gegenteil. Natürliches Gerechtigkeitsempfinden verflüchtigt sich. Das ist nicht die Art von Gemeinschaftsverwaltung, die normalerweise gut funktioniert.

Ich weiß das. Ich war selbst diesem Prozess ausgesetzt. Es ist hässlich. Es muss einen besseren Weg geben.

RGJ · 26. Juni 2026 um 09:39

Relevante Lektüre, insbesondere der zweite Artikel, war für mich bei der ersten Lektüre aufschlussreich. Das gilt meiner Meinung nach teilweise auch für dich, @robbie.morrison. Manche Leute „schreiben einfach so“.

Und ich bin zu dieser These gekommen: Ich schreibe nicht wie ChatGPT. ChatGPT schreibt auf seine seltsame, entkörperlichte, global beschaffte Weise wie ich. Oder genauer gesagt: Es schreibt wie die Millionen von uns, die durch einen ganz bestimmten bildungs- und gesellschaftlichen Filter gedrückt wurden, ein Filter, der bewusst darauf ausgelegt war, Unschärfen wegzuschleifen und unsere Gedanken in eine ganz bestimmte, sehr formale und sehr beeindruckende Form zu pressen.

one1 · 26. Juni 2026 um 09:52

Ja, die Voreingenommenheit gegenüber Nicht-Muttersprachlern ist eine meiner größten Sorgen.

Es ist zwar keine Discourse-Community, aber das hier ist eine interessante Lektüre: Rules Roundtable XXI.V: Plagiarism, Integrity, and Generative AI. Das stammt aus dem AskHistorians-Subreddit. Für diejenigen, die damit nicht vertraut sind: Dies ist wahrscheinlich eine der am strengsten moderierten Communities auf Reddit. Grundsätzlich werden dort nur Antworten auf akademischem Niveau zu Fragen akzeptiert.

robbie.morrison · 26. Juni 2026 um 10:09

Das AskHistorians-Reddit hat immer noch eine „First-Shot“-Bias, gefolgt von einer umgekehrten Beweislast für die Angeklagten (aber mit Sicherheit mehr Verfahrensgerechtigkeit als bei Wikipedia/Wikimedia):

Wenn du nicht angibst, dass du KI zur Beantwortung einer Frage genutzt hast, und wir den Verdacht haben, dass du KI auf eine regelwidrige Weise einsetzt, wirst du gesperrt. Allerdings wird jeder, der wegen KI-Nutzung gesperrt wurde, darüber informiert, wie er eine Berufung einreichen kann. Es fühlt sich hart an, aber ein Teil unserer Begründung ist, die Menschen zur Modmail zu bringen, damit wir eine Diskussion führen und einer öffentlichen Bloßstellung vorbeugen können, die zu Shitstorms führen kann.

Vielleicht ist das zurzeit die einzige praktikable Strategie? Aber kaum natürliche Gerechtigkeit.

one1 · 26. Juni 2026 um 13:56

Ja, ich schätze, dieser Sub dreht sich überhaupt nicht um „Community“. Sie sind gnadenlos, was sie akzeptieren – egal ob KI oder nicht.

Aber jemanden insgesamt des Einsatzes von KI zu beschuldigen, ist voller Fallstricke.

chapoi · 26. Juni 2026 um 15:02

Ich benutze den – schon seit Ewigkeiten, und jetzt kann ich das nicht mehr, weil die Leute denken, es sei KI. Adieu, langer Bindestrich.

one1 · 26. Juni 2026 um 15:47

Ja, eigentlich könnte jeder verdächtig sein, der Markdown nutzt und einen gut geschriebenen Beitrag verfasst.

awesomerobot · 26. Juni 2026 um 16:39

Genauso! Ich habe den Gedankenstrich seit Jahren übermäßig verwendet, bevor die KI aufkam und ihn sich geschnappt hat

Canapin · 26. Juni 2026 um 16:41

Ich mache zu viele Fehler, um fälschlicherweise als KI identifiziert zu werden

Seltsamerweise habe ich bemerkt, dass ich im Vergleich zu früher eher dazu neige, kleine Fehler, die ich in meinen eigenen Beiträgen bemerke, freiwillig nicht zu korrigieren (sogar in Französisch, meiner Muttersprache). Ich habe das Gefühl, dass das Beibehalten dieser Unvollkommenheiten dem, was ich schreibe, Authentizität und mehr Identität verleiht. Menschen könnten eine Nachricht aufgrund dieser Fehler oder seltsam formulierter Sätze als meine erkennen. Es ist außerdem weniger anstrengend für den Geist, nicht alles, was ich schreibe, perfekt zu machen (was auch immer das bedeuten mag).

stephtara · 11. Juli 2026 um 06:01

Meine Community ist noch nicht wirklich aktiv, aber ich bin fest davon überzeugt, dass wir nicht wollen, dass Leute Inhalte von LLMs posten. Für den Moment bin ich mit Crawlern einverstanden und möchte, dass wir einen LLM-Bot oder LLM-Systemnachrichten haben, aber ich möchte nicht, dass Mitglieder ihren ChatGPT-Mist posten (wir haben eine riesige Menge an handgefertigter Dokumentation, die wir nutzen möchten).

Es wird in den Regeln stehen und wir werden es « moderieren », wenn wir es sehen, aber ich bin an automatischem Flagging und anderen Strategien interessiert.

Übrigens ist es eine frankophone Community.

eisammy · 11. Juli 2026 um 13:44

Im Allgemeinen bevorzuge ich wenige Themen und Beiträge, die im globalen Feed deutlich interessanter sind. Auch für das SEO ist das wichtig, da die Indizierung von KI-generierten Inhalten von traditionellen Suchmaschinen meist bestraft wird.

Da Discourse-Instanzen in den meisten Fällen öffentlich zugänglich sind, werde ich natürlich sofort wieder gehen, wenn ich eine andere Instanz besuche, deren Inhalt überwiegend aus KI-Schlamm besteht oder mit diesem vermischt ist.

Jagster · 11. Juli 2026 um 13:59

Wie… hier

eisammy · 11. Juli 2026 um 14:06

Was genau ist dein Punkt? Es gibt einen großen Unterschied zwischen der Nutzung als Werkzeug, wie etwa einem automatischen Sprach- und Inhaltstranslator, und themenspezifischen Inhalten, wie sie bei meiner Instanz der Fall sind, sowie anderen Aspekten. Vielleicht hast du meinen Kommentar zu wörtlich genommen, oder? Das ist eine genuine Frage.

Jagster · 11. Juli 2026 um 14:10

Mein Punkt ist, dass du nicht so absolut bist, wie du sagst. Du akzeptierst KI-generierte Inhalte, denn hier gibt es sie. Meistens im Code-Bereich, aber auch die Beiträge auf ask.discourse.org sind keine Ausnahme.

Also fordere ich Konsistenz ein

eisammy · 11. Juli 2026 um 14:13

Natürlich, nichts im Leben ist absolut, aber wie du richtig gesagt hast, wenn der Inhalt einer Instanz hauptsächlich oder in gemischter Form von KI generiert wird, werde ich ihn natürlich ablehnen. Wieder scheint es, als würdest du in Diskussionen oft die Literalität ausnutzen, oder? Anstatt ironisch zu sein, versuche es beim nächsten Mal, die Dinge klar zu machen.

merefield · 11. Juli 2026 um 19:06

Ich bin mir nicht so sicher, dass es so einfach ist, KI-Inhalte zu erkennen, die mit sorgfältig formulierten Prompts erstellt wurden, um offensichtliche Marker und Muster zu entfernen.

Wahrscheinlicher ist, dass die gesamte Website durch manuelle Prüfung als „von Bots erstellt“ markiert wird.

Suchmaschinen sind schlecht darin, das zu erkennen.

Hier ist ein Fall, der das illustriert:

OpenAI Releases GPT-5.6 Soul, Terra and Luna Models - Geeky Gadgets.

Dieses Ergebnis landete in den Top 5 der Suchergebnisse, aber die falsche Schreibweise von „Sol“ verrät, dass es sich um minderwertigen Inhalt handelt.

Die Betreiber dieser Website haben den Inhalt nicht einmal überprüft. Kein Mensch würde diesen Fehler machen.

Thema		Antworten	Aufrufe
Block Google's "Help Me Write" Feature	19	2430	8. April 2024
Experiments with AI based moderation on Discourse Meta Community Building moderation , ai	11	1310	26. Mai 2025
Are you experiencing AI based spam? Community Building ai	22	2325	19. Januar 2025
What is stopping you from trying out Discourse AI? Community Building ai	35	2153	23. August 2025
How to prevent community content from being used to train LLMs like ChatGPT? Community Building	69	5205	16. Juli 2023

Foren, die KI-Inhalte verbieten… Wie läuft das?

Verwandte Themen