最近のスパムの波をブロック

数日間、大規模なスパムの波に襲われています。https://ask.learncbse.in/ のような他のサイトは、今のところ諦めているようです :thinking:

ここで探しているのは、このバリアントだけです。

コンテンツは頻繁に変わり、メールアドレスやIPアドレスも変わるため、ブロックすることで量は減りますが、まだ本当の解決策は見つかっていません。プライバシー上の理由から、すべてをAkismentに送信したくありません。

もしブロックするとしたら

AS55836: Reliance Jio Infocomm Limited
AS9498: Bharti Airtel Ltd.
AS45609: Bharti Airtel Ltd.
AS24560: Bharti Airtel Ltd.

これで問題ないのですが、これはインドの人口の大部分(または一部)を占める可能性があります。

「いいね!」 4

管理者 → カスタマイズ → 監視単語 → 承認必須」に特定の単語を追加してみましたか?

スクリーンショットから、以下の単語を追加することをお勧めします。

  • cash
  • credit
  • money
  • loan
  • toll-free
  • customer care
  • care number
  • 0779*
  • helpline
  • :point_left:

ユーザーにとっては少し不便かもしれませんが、DiscourseからFirebase Cloud Functions(無料)にWebhookを送信し、Slackチャットルームで私の携帯に通知が来るようにしています。そのため、 awake な限り、多くの場合、携帯から60秒以内にモデレーション投稿を承認できます。

「いいね!」 3

ヒントをありがとうございます。しかし、https://ask.learncbse.in/ を確認していただけますでしょうか(私のインスタンスではありませんが、投稿は多かれ少なかれ同じものと戦っています)。そして、ここ数日の投稿をスクロールしてみてください。彼らは各キーワードの多くの組み合わせとバリエーションを使用しています。私は各キーワードに対して多くの正規表現を作成するプロセスにありますが、彼らはどこにでも「.」、「,」、「|」を追加し、「0」を「O」に、「e」を「3」に置き換え、単語の途中に(今のところ)ランダムな文字を追加しています。このようなスパムと戦うのは本当に難しいです。

あるいは、ランダムなリンクをクリックしたくない場合は、ここ数時間のスクリーンショットを以下に示しますが、これはほんの数時間のもので、時間とともに大きく変化します。

「いいね!」 1

確認ですが、管理設定の「最初の投稿の最小入力時間」を使用していますか?これは、多くの投稿をキャッチするのに非常に役立つと思います。

「いいね!」 5

はい、ヒントありがとうございます。これは設定されていますが、ボットが数分待つだけではそれほど難しくないのではないでしょうか :slight_smile:

「いいね!」 1

このスパムは、他のトピックで扱われているAIベースの回答/コンテンツとは異なるタイプのように思われるため、分割しました。:+1:

スパム検出用の新しいAIベースのツールがあり、これは非常に効果的であることが証明されています。

「いいね!」 6

ヒントをありがとう。しかし、私たちのディスコースで別のスパマーLLMと戦うためだけにLLMをセットアップするのは、私たちのユースケースには高すぎます。

スパマーは、より多くのユーザー/投稿を作成するだけで、組織のコストを簡単に増やすことができます。そのため、達成したいことに応じて、さらに多くの投稿を作成することも動機になる可能性があります :slight_smile:

「いいね!」 1

こんにちは。

Akismet を試しましたか?彼らのソリューションがあなたに役立つようです。

(個人利用は無料、商用利用は有料です。どちらに分類されるかはわかりませんが)

「いいね!」 2

おそらく、すべてのユーザーの最初の投稿を承認制にすれば、少しは役に立つのではないでしょうか? そうすれば、少なくとも公開フォーラムに投稿されることはなくなり、毎日多くの実際のユーザーが登録しない限り、ある程度は役立つと思います。

「いいね!」 5

ヒントをありがとうございます。

それについても考えましたが、プライバシーとセキュリティ製品を使用しているため、ユーザーを可能な限り保護する必要があります。コンテンツは確かに公開されていますが、IPアドレス/エージェント/参照元/電子メールは、Discourse Akismet を正しく理解していれば、Akismet に送信されるため、そうではありません(プライバシーポリシーも読むべきですが、概要は決定のための十分な情報です)。

それは良い考えでしょう。1日あたり約2件の登録なので、それほど問題にはならないはずですが、承認を待つのは最高の体験ではありません。しかし、適切に説明すれば、現時点での最良の選択肢かもしれません。

「いいね!」 1

はい、残念ながらその通りです。Akismetにはプライバシーポリシーに沿わない可能性のある追加データが送信されます。その場合、@Firepup650さんの提案が最善です

「いいね!」 1

参考までに、私の Geo Blocking plugin は、ソースASネットワークに基づいてDiscourseへのアクセスを拒否できます。実際、この種のスパムの多くは、特にAS45609から発信されているようです。

インドの半分をブロックしたくない場合は、そのプラグインの一部の機能を再利用して、承認ロジック(「ネットワークからの新規投稿には承認が必要」)にネットワークまたはIPベースのルールを追加することがどれほど難しいかを調査する価値があるかもしれません。

「いいね!」 6

多くのページをそのサンプルサイトで確認しましたが、Discourseの正規表現がUnicode範囲で機能するなら、ウォッチワード機能でそれらのほとんどをブロックできるかもしれません。

通常のユーザーは、おそらく以下のようなものは使用しないでしょう。

  • 連続する2つ以上のスラッシュ
  • 句読点(数式サイトでない限り、^のようなもの)
  • 一般的でないUnicode範囲:
    • ✓ (Miscellaneous Symbols)
    • ∆ (Greek and Coptic)
    • ❽, ➁, ❸, 3, ❷ (Dingbats)
    • 𝘾, 𝙪, 𝙨, 𝙩 (Mathematical Alphanumeric Symbols)

Discourseがサポートしていれば、ChatGPTはそれらのための正規表現を作成できるかもしれません。

もう一つのアイデアは、CloudflareのBot Fight Mode機能(無料)を試して、すべてのボットにチャレンジさせることです。

「いいね!」 3

おお、それは完璧な解決策になりそうです。コードを確認してみます。ありがとうございます!

問題は、このボットがどのようにDiscourseが機能するかを理解していることです。次のシナリオでは、「承認が必要」セクションで❽を監視しています。問題は、これらのボットがしばしば最初にランダムなテキストを作成し、その後実際のコンテンツに編集することです。投稿の編集は「承認が必要」リストに対してチェックされません。例を参照してください。

対する

(ここでは、投稿作成中に❽を直接追加しました)

つまり、唯一の選択肢はブロックセクションに追加することですが、単語や文字をブロックしすぎると、通常のユーザーが有効な投稿を作成する際に混乱するメッセージが表示される問題に簡単に陥る可能性があります。これが私たちの問題のほとんどの原因だと思います。私の意見では、これはバグであり、投稿を編集する際にも、「承認が必要」リストは、変更が公開されたときに編集されたコンテンツに対してチェックされるべきです。

「いいね!」 2

監視ワードは役に立たないようですね。まだスパム攻撃はありませんが、ユーザーがそれに気づき始めているので心配です(こちら)。

「いいね!」 3

私のフォーラムの1つが、ちょうど同じようなスパム攻撃を受けたようです。スパム単語をまだ監視単語リストに入れていなかったので、編集トリックが使われたかどうかはわかりません。

「いいね!」 2

こんにちは皆さん :waving_hand:

これの概念実証があります。もしよろしければご覧ください。

「いいね!」 1

素晴らしい仕事です、@juanjosegzl さん。喜んでPRとして受け入れます!:rocket:

ありがとうございます @RGJ PR を開きました

「いいね!」 1

こんにちは、@juanjosegzl さん。

あなたの最後のPRでプラグインが壊れてしまいました。地理的な場所に関係なく、モデレーションで全員に投稿を確認するように求めています(モデレーター自身にも)。回避策や修正のETAはありますか?