AIコンテンツを禁止するフォーラム…どうなってるの?

AI/LLM生成コンテンツを禁止しているフォーラムのスタッフの皆様に、その体験をお聞かせください。ユーザーにどのようにこのルールを伝えていますか?また、どのようにして生成コンテンツを検出していますか?万一投稿された場合、ユーザーにはどのように対応していますか?

どんなご意見でも大歓迎です。

「いいね!」 1

AIによるテキストのほとんど、あるいはすべては、単に読むだけで簡単に検出できます。GoogleのSynthIDは、AI画像を検出するためのクールな技術で、おそらくGeminiのみが書いたテキストも検出できると主張していますが、OpenAIもこの標準をサポートしています。実際に自分でテキストを検出できる能力は、おそらく習得するスキルですが、AIの画像やテキストを検出できないという現在の危機に対応するための取り組みには感謝しています。

ミュートやアカウント停止は、私の意見では、特に新しいアカウントの場合、まだ適切な対応方法だと思います。もしあなたのサイトに突然参加して、すぐにAI生成のトピックを投稿するランダムな新しいアカウントがあれば、アカウントを停止してブロックする理由は何もないと思います。

スクレイピングの問題全体について:私のサイトは現在、小規模な会社内の内部コミュニケーションとドキュメントのために使用されており、最終的にはブログのバックエンドとして使用することを計画しています。ドメインのrobotstxtファイルを無視するクローラーを追い払うためのハニーポットを設定するのは難しくはありませんでした。

この戦術一つだけで、2週間の間に600万リクエストほどが発生しました(ドメインに対して約6req/s):

AIクローラーがそのサイトを訪れると、彼らはiocaineプロジェクトを使用して、約7000語の架空の単語、いくつかの無意味なHTML、ランダムな単語、8B Llamaによって作成されたフェイクニュースを含むデータセットで自己ホストされた、スパムでいっぱいになった無限の迷路に導かれます。

もちろん、これは「立ち去れ」という核兵器のような戦術であり、すべての人に適しているわけではありませんが、LLMが私のコードやテキストコンテンツを奪うのを防ぐという私の目標には非常に役立っています。AnthropicがLLMのポイズニングについて行ったケーススタディを読んだことを覚えています。しかし、その記事はもう見つからないので、ここでは添付されませんが、ボットが私のドメインに500万リクエストを送信したことに気づいた時点で、彼らは私のドメインをブロックする必要があるはずです。

「いいね!」 2