AIスパムボットはスパムではないと言っているが、スキャンログはスパムだと言っている

J-Ha_Hasegawa · 2025 年 8 月 20 日午前 12:20

Discourse AI のスパム処理をフォーラムで有効にしました。API キーを使用して Claude Sonnet 4 を設定し、スパム検出担当者のペルソナを選択しました。

明らかにスパムであるテスト投稿を行いました。わかりやすいスパムです。

ブロックされず、すぐに投稿されました。

テスト機能を使用して投稿 URL をスパムボットに渡したところ、結果は「スパムではありません」と表示されましたが、スキャンログには「SPAM - これは明確な宣伝広告です…」と表示されています。

私の期待としては、結果がスキャンログの SPAM という宣言と一致して SPAM となることでした。そして、例えば、管理者がレビューするために投稿がキューに並べられることでした。

何か見落としている点があれば、どなたか教えていただけますでしょうか？私は専門家ではありませんので、どんなアドバイスでも歓迎します！

ありがとうございます！

Roman · 2025 年 8 月 20 日午前 12:34

投稿したユーザーの信頼レベルはいくつですか？AIスパムはTL2以上のユーザーからの投稿をスキップします。

J-Ha_Hasegawa · 2025 年 8 月 20 日午前 12:48

返信ありがとうございます！

投稿に使用したユーザーはTrust Level new userです。

投稿が承認された理由について、何か考えはありますか？

ご協力に感謝いたします！

Roman · 2025 年 8 月 20 日午後 5:09

これにより、テストと投稿の両方がフラグ付けされないようになります。

スパム検出器のペルソナシステムプロンプトは、Claudeモデルを混乱させていました。この変更により、期待される応答形式の指示がより明確になります。

J-Ha_Hasegawa · 2025 年 8 月 22 日午前 1:33

素晴らしい！テスト機能は期待どおりに動作しています。

AIスパム機能が、スパム投稿を即座にブロックできない理由について、お手伝いいただけないでしょうか？AIスパムテストに投稿を送信したところ、スパムとしてフラグが立てられましたが、投稿されてしまいました。

何か接続が欠けているのでしょうか？ご協力いただき、誠にありがとうございます！

Jagster · 2025 年 8 月 22 日午前 5:05

あなたは管理者、または上位のTLですか？もしそうなら、低TLのテストユーザーを使ってみるかもしれません。

Roman · 2025 年 8 月 22 日午後 1:25

投稿は以下の場合にスキップされます。

テストが機能している場合、上記いずれかが原因であると確信しています。

J-Ha_Hasegawa · 2025 年 8 月 22 日午後 3:29

ああ、ありがとうございます！忍耐強く、親切なご返信に感謝いたします！

信頼度レベル0のユーザーではなく、管理者ユーザーで投稿してしまいました。

うまくいきました！discourse_ai_spam ユーザーが、投稿をフラグ付けして非公開にしたユーザーとして表示されるのが気に入っています。

この件について、迅速かつ寛大なご支援をいただき、重ねて感謝いたします！

トピック		返信	表示
Discourse AI - Spam detection Site Management moderation , how-to , ai , spam	22	2432	2025 年 9 月 25 日
AI powered Spam detection Announcements ai , spam	11	912	2025 年 1 月 11 日
Are you experiencing AI based spam? Community ai	23	1804	2025 年 1 月 19 日
Discourse AI spam detection "Scan log" is frequently truncated Bug ai	0	47	2025 年 7 月 8 日
Setting up spam detection in your community Site Management moderation , automation , how-to , ai	11	1726	2025 年 1 月 30 日