AIコンテンツを禁止するフォーラム…どうなってる？

one1 · 2026 年 6 月 19 日午前 3:00

AI/LLMによる生成コンテンツを許可していないフォーラムのスタッフの皆様に、その経験を伺いたいです。ユーザーに対してどのようにこの方針を伝えていますか？また、どのように検知していますか？それでも投稿してしまったユーザーに対しては、どのようにアプローチしていますか？

ご意見・ご感想をぜひお聞かせください。

注：個人的には、サイトのフロントエンドにおける人間同士のやり取りに関する側面のみに関心があります。クローラーのブロックはもはや不可能だと考えています。

私たちのフォーラムは、精神的・宗教的な議論を行う場です。AI生成コンテンツは一切禁止しています。

darkpixlz · 2026 年 6 月 19 日午前 4:43

AIによるテキストのほとんど、あるいはすべては、単に読むだけで簡単に検出できます。GoogleのSynthIDは、AI画像を検出するためのクールな技術で、おそらくGeminiのみが書いたテキストも検出できると主張していますが、OpenAIもこの標準をサポートしています。実際に自分でテキストを検出できる能力は、おそらく習得するスキルですが、AIの画像やテキストを検出できないという現在の危機に対応するための取り組みには感謝しています。

ミュートやアカウント停止は、私の意見では、特に新しいアカウントの場合、まだ適切な対応方法だと思います。もしあなたのサイトに突然参加して、すぐにAI生成のトピックを投稿するランダムな新しいアカウントがあれば、アカウントを停止してブロックする理由は何もないと思います。

スクレイピングの問題全体について：私のサイトは現在、小規模な会社内の内部コミュニケーションとドキュメントのために使用されており、最終的にはブログのバックエンドとして使用することを計画しています。ドメインのrobotstxtファイルを無視するクローラーを追い払うためのハニーポットを設定するのは難しくはありませんでした。

この戦術一つだけで、2週間の間に600万リクエストほどが発生しました（ドメインに対して約6req/s）：

AIクローラーがそのサイトを訪れると、彼らはiocaineプロジェクトを使用して、約7000語の架空の単語、いくつかの無意味なHTML、ランダムな単語、8B Llamaによって作成されたフェイクニュースを含むデータセットで自己ホストされた、スパムでいっぱいになった無限の迷路に導かれます。

もちろん、これは「立ち去れ」という核兵器のような戦術であり、すべての人に適しているわけではありませんが、LLMが私のコードやテキストコンテンツを奪うのを防ぐという私の目標には非常に役立っています。AnthropicがLLMのポイズニングについて行ったケーススタディを読んだことを覚えています。しかし、その記事はもう見つからないので、ここでは添付されませんが、ボットが私のドメインに500万リクエストを送信したことに気づいた時点で、彼らは私のドメインをブロックする必要があるはずです。

Ed_S · 2026 年 6 月 19 日午前 8:24

（クローラーの負荷、トレーニング目的でのコンテンツの取得、そして現在の急速な発展に伴う社会的・経済的影響といった問題については棚上げにしていることに気づきました。それは結構なことだと思います。）

私自身の経験として、投稿数の少ない趣味用のサイトでは、

書面による方針の合意形成と策定を試みている
発生した問題に対応する
最もひどい例は essentially スパムなので、削除して BAN する
それ以外は、公開または非公開で抗議し、場合によっては投稿を削除する

ガイドラインの例としては、以下のような形が考えられます：

投稿するメッセージのコンテンツを「所有」する（つまり、どこから来たかに関係なく、コンテンツを盲目的にコピー＆ペーストするのではなく、読み、理解する）。
新しいスレッドを立てる前に、まず自分自身で質問に答えるように努める（例えば、フォーラムを検索するなど）。
他のユーザーが読んで理解し、助けられるように、具体的かつ簡潔に伝える。つまり、繰り返しの多い不要なテキストの壁や、十分な情報がない過度に広い声明を避ける。
議論をトピックに集中させ、メタ議論（特に AI の使用に関する「ベストプラクティス」や「その倫理」など）を避ける。
会話では敬意を持ち、異なる背景、見解、意見を持つユーザーがいることを忘れない。
楽しんでください！これは趣味のためのものです。

（私たちの趣味の環境では、LLM の趣味内での使用という追加の側面があり、これは可能性のスペクトルをカバーし、愛好家と反対派の両方を持っています。）

robbie.morrison · 2026 年 6 月 26 日午前 9:18

この例は Discourse を対象としていませんが、政策やガバナンスの問題は確かに重複するでしょう。

英語版とドイツ語版のWikipediaの両方とも、私が極端な AI 純粋主義ポリシーと呼ぶべきものを導入しています。16 年の編集経験を持つ編集者として、私が主に執筆した記事に AI 生成コンテンツを追加したと誤って非難されました。そして、その救済を求める過程は非常に苦痛を伴うものでした。これには、Wikipedia 英語版の仲裁委員会（ArbCom）およびウィキメディア財団の信頼と安全チーム（WMF TST）への正式な苦情申し立てが含まれていますが、いずれもこれまで、それぞれ即時却下され、あるいは理由もなく拒否されました。

私の経験をここで詳しく語るつもりはありません。一部には、現在も進行中のためです。しかし、読者の皆様には、カリフォルニア州のモドック族にとって文化的に重要なファーン・ケイブに関する Wikipedia 英語版の記事をめぐる、この驚くべきやり取りをご覧いただくことをお勧めします。

https://en.wikipedia.org/wiki/User_talk:Gurkubondinn/Archives/2026#No_LLM_Mark_on_fern_caves

問題の投稿者は、AI の使用を4 回も否定せざるを得ませんでした。その過程で、彼らの先住民の知識も軽視されました。執行を担う編集者の結論は、一見懸念を示すような発言ですが、同じく、従わない場合の制裁を暗示する脅迫ともとれるものです。

このような心理的戦術は、執行を担う編集者によって日常的に用いられており、他にも証拠となる事例を保有しています。

同じやり取りのソースマークアップをご覧いただければ、被疑者が返信を作成する際に AI 使用を検出しようとして仕掛けられた font-size: 0pt のハニポット・トラップが存在することがわかります。このトラップは発動しませんでした。

Wikipedia ドイツ語版では、AI ツールの使用が疑われて「不当な攻撃」を受けた複数の編集者が離脱したという信頼できる報告があります。

このトピックで提起された元の質問にお答えすると、Wikipedia 英語版およびドイツ語版は、AI コンテンツへの対応において、ガバナンスの面で複数の点で深刻に失敗していると私は主張します。私は最近、WMF TST チームに提出した 17 ページの報告書で、3 つの事例研究を記録しました。その PDF を将来的に公開する可能性もあります。

robbie.morrison · 2026 年 6 月 26 日午前 9:33

私は強く異議を唱えます。ウィキペディア英語版での私の経験（このトピックについて他で詳述済み）に基づけば、このアプローチは主に疑似科学と傲慢さが混ざったものに過ぎません。より重要なのは、そのような検出を反証することが不可能であるという点です。実際、ウィキペディアの執行編集者たちは、しばしば連携して、挑戦に対してさらに頑なに抵抗します。

告発された編集者は、立証責任の逆転に直面し、反証不可能な告発にさらされます。これには、それと矛盾する最も説得力のある証拠があっても変わりません。自然正義は消え去ります。これは、通常機能するコミュニティ運営のあり方ではありません。

私は知っています。私はこのプロセスを直接経験しました。醜悪です。もっと良い方法があるはずです。

RGJ · 2026 年 6 月 26 日午前 9:39

特に2つ目の記事は、私が初めて読んだときに目からウロコでした。あなたもそうだと思いますよ、@robbie.morrison さん。ある種の人は「もともとそういう書き方をする」ものです。

そして私はこのような結論に至りました。「私はChatGPTのように書きません。ChatGPTは、奇妙で、肉体を持たず、世界中のデータから学習した方法で、私のように書きます。より正確に言えば、それは、曖昧さを削り落とし、私たちの思考を非常に具体的で、非常に形式的で、非常に印象的な形に鍛え上げるために意図的に設計された、非常に特定の教育的・社会的パイプラインをくぐり抜けてきた何百万人もの私たちと同じように書いているのです。」

one1 · 2026 年 6 月 26 日午前 9:52

はい、非ネイティブの英語話者に対するバイアスは、私が最も懸念している点の一つです。

Discourseのコミュニティではありませんが、これは興味深い読み物です：ルール・ラウンドテーブル XXI.V: 盗用、誠実さ、生成AI。これはAskHistoriansのサブレッドからのものです。ご存知ない方のために説明すると、これはおそらくReddit上で最も厳格にモデレーションされているコミュニティの一つです。彼らは基本的に、質問に対して学術レベルの回答しか許可していません。

robbie.morrison · 2026 年 6 月 26 日午前 10:09

AskHistoriansのredditには依然として「先に撃て」バイアスがあり、被告側には逆の立証責任が課されています（ただし、Wikipedia/ウィキメディアに比べると確かに適正手続きは守られています）：

あなたがAIを使用して回答を生成したことを明言しない場合、かつ私たちがあなたがルール違反の方法でAIを使用している可能性を疑っている場合、あなたはBANされます。ただし、AI使用でBANされた全員には、異議申し立ての手順が伝えられます。厳しく感じられるかもしれませんが、私たちの根拠の一部は、人々をmodmailに誘導して議論を行い、パイルオン（多数による攻撃）に発展しかねない公的な非難を避けることにあります。

おそらく、それが現在において唯一実行可能な戦略なのでしょうか？しかし、決して自然な正義とは言えません。

one1 · 2026 年 6 月 26 日午後 1:56

ああ、あのサブレディットは「コミュニティ」などとは全く関係ないみたいだね。AI かどうかにかかわらず、投稿の受け入れには容赦ないんだ。

でも、誰かが AI を使っていると非難すること自体が、いろいろと問題をはらんでいるよ。

chapoi · 2026 年 6 月 26 日午後 3:02

僕はずっと長ダッシュ（–）を使ってきたのに、今は使えなくなっちゃった。AIが使ってると思われるからだ。さようなら、長ダッシュ。

one1 · 2026 年 6 月 26 日午後 3:47

はい、実際、Markdownを活用してよく書かれた投稿を作成する人なら誰でも疑わしい可能性があります。

awesomerobot · 2026 年 6 月 26 日午後 4:39

同じ！AIが現れてそれを奪うずっと前から、私はエムダッシュを乱用してました

Canapin · 2026 年 6 月 26 日午後 4:41

AI と誤認されるほど間違いが多すぎます

奇妙なことに、以前よりも自分の投稿で見つけた小さな間違いを、あえて訂正しない傾向が強くなったことに気づきました（母語であるフランス語でさえも）。そうした不完全さを残すことで、自分の書いたものがより真実味を持ち、独自のアイデンティティを帯びるような気がします。これらの間違いや変な文の書き方によって、人々が私のメッセージだと識別できるようになるかもしれません。また、何を書くにしても完璧を目指そうとしないのは、精神的にも疲れにくいのです（「完璧」が何を意味するかはともかく）。

stephtara · 2026 年 7 月 11 日午前 6:01

私のコミュニティはまだ活発ではありませんが、LLM（大規模言語モデル）生成コンテンツを投稿することを望んでいないという考えを強く持っています。現時点では、クローラーは問題ないと考えており、LLMボットやLLMシステムメッセージの導入には前向きですが、メンバーがChatGPTで生成した粗雑なコンテンツを投稿することは望んでいません（人々に活用してほしい手作業で作成した膨大なドキュメントがあります）。

これはルールに記載し、発見次第「モデレート」しますが、自動フラグ機能やその他の戦略にも関心があります。

参考までに、これはフランス語圏のコミュニティです。

eisammy · 2026 年 7 月 11 日午後 1:44

正直なところ、私はグローバルフィードでより興味深いトピックや投稿が少量である方が好みです。これはSEOの観点からも重要で、AI由来のコンテンツのインデックスは伝統的な検索エンジンから一般的にペナルティを受けるからです。

いずれにせよ、Discourseは多くの場合公開性質であるため、AIスラップ（低品質なAI生成コンテンツ）が主流であったり混在している別のインスタンスにアクセスした場合、私は自然と離れてしまいます。

Jagster · 2026 年 7 月 11 日午後 1:59

まあ… ここにいるけど

eisammy · 2026 年 7 月 11 日午後 2:06

あなたの言いたい点は、具体的に何ですか？言語やテーマ別のコンテンツ（私のインスタンスの場合など）の翻訳ツールとしての利用と、他の用途との間には大きな違いがあります。もしかすると、私のコメントを文字通り読みすぎたのかもしれませんね？これは真摯な質問です。

Jagster · 2026 年 7 月 11 日午後 2:10

私の言いたいことは、あなたが言うほど絶対的ではないということです。あなたはAI生成コンテンツを許容しています。なぜなら、ここにはそのようなコンテンツが存在するからです。主にコード関連の分野でですが、ask.discourse.orgのセクションも例外ではありません。

したがって、一貫性を求めます🤷

eisammy · 2026 年 7 月 11 日午後 2:13

もちろん、人生に絶対なんてものはありませんが、先ほど言いましたように、あるインスタンスのコンテンツが主に、あるいは混合してAI生成のコンテンツで構成されている場合、私は当然それを拒否します。再び申し上げますが、あなたは議論で文字通りの意味にこだわる傾向があるようですよね？皮肉を言う代わりに、次は物事を明確に伝えるようにしてください。

merefield · 2026 年 7 月 11 日午後 7:06

慎重なプロンプトを用いて明らかな特徴やパターンを除去したAI生成コンテンツを検知するのは、それほど簡単ではないと思います。

むしろ、サイト全体が手動検査によって「ボット作成」としてフラグ立てられる可能性の方が高いでしょう。

検索エンジンはそれを捕捉するのが下手です。

以下はその一例です。

OpenAI Releases GPT-5.6 Soul, Terra and Luna Models - Geeky Gadgets.

これは検索結果の上位5件の中に登場しましたが、「Sol」の誤記が、それが粗悪なコンテンツ（slop）であることを暴露しています。

そのサイトの所有者によって確認もされていません。人間ならそんな間違いはしません。

トピック		返信	表示
Block Google's "Help Me Write" Feature	19	2430	2024 年 4 月 8 日
Experiments with AI based moderation on Discourse Meta Community Building moderation , ai	11	1310	2025 年 5 月 26 日
Are you experiencing AI based spam? Community Building ai	22	2325	2025 年 1 月 19 日
What is stopping you from trying out Discourse AI? Community Building ai	35	2153	2025 年 8 月 23 日
How to prevent community content from being used to train LLMs like ChatGPT? Community Building	69	5205	2023 年 7 月 16 日

AIコンテンツを禁止するフォーラム…どうなってる？

関連トピック