AIスパムボットはスパムではないと言っているが、スキャンログはスパムだと言っている

Discourse AI のスパム処理をフォーラムで有効にしました。API キーを使用して Claude Sonnet 4 を設定し、スパム検出担当者のペルソナを選択しました。

明らかにスパムであるテスト投稿を行いました。わかりやすいスパムです。

ブロックされず、すぐに投稿されました。

テスト機能を使用して投稿 URL をスパムボットに渡したところ、結果は「スパムではありません」と表示されましたが、スキャンログには「SPAM - これは明確な宣伝広告です…」と表示されています。

私の期待としては、結果がスキャンログの SPAM という宣言と一致して SPAM となることでした。そして、例えば、管理者がレビューするために投稿がキューに並べられることでした。

何か見落としている点があれば、どなたか教えていただけますでしょうか?私は専門家ではありませんので、どんなアドバイスでも歓迎します!

ありがとうございます!

投稿したユーザーの信頼レベルはいくつですか?AIスパムはTL2以上のユーザーからの投稿をスキップします。

「いいね!」 4

返信ありがとうございます!

投稿に使用したユーザーはTrust Level new userです。

投稿が承認された理由について、何か考えはありますか?

ご協力に感謝いたします!

これにより、テストと投稿の両方がフラグ付けされないようになります。

スパム検出器のペルソナシステムプロンプトは、Claudeモデルを混乱させていました。この変更により、期待される応答形式の指示がより明確になります。

「いいね!」 4

素晴らしい!テスト機能は期待どおりに動作しています。

AIスパム機能が、スパム投稿を即座にブロックできない理由について、お手伝いいただけないでしょうか?AIスパムテストに投稿を送信したところ、スパムとしてフラグが立てられましたが、投稿されてしまいました。

何か接続が欠けているのでしょうか?ご協力いただき、誠にありがとうございます!

「いいね!」 1

あなたは管理者、または上位のTLですか?もしそうなら、低TLのテストユーザーを使ってみるかもしれません。

「いいね!」 1

投稿は以下の場合にスキップされます。

  • 投稿者の信頼レベルがTL1より高い場合。
  • 投稿がプライベートメッセージトピックに属している場合。
  • 投稿者がボットである場合。
  • 投稿者がスタッフ(モデレーター/管理者)である場合。
  • 投稿者が通常の(PMではない)トピックで3回以上投稿している場合。
  • 投稿が既に3回以上スキャンされている場合。

テストが機能している場合、上記いずれかが原因であると確信しています。

「いいね!」 1

ああ、ありがとうございます!忍耐強く、親切なご返信に感謝いたします!

信頼度レベル0のユーザーではなく、管理者ユーザーで投稿してしまいました。:woman_facepalming:

うまくいきました!discourse_ai_spam ユーザーが、投稿をフラグ付けして非公開にしたユーザーとして表示されるのが気に入っています。

この件について、迅速かつ寛大なご支援をいただき、重ねて感謝いたします!

「いいね!」 3