Discourse AI のスパム処理をフォーラムで有効にしました。API キーを使用して Claude Sonnet 4 を設定し、スパム検出担当者のペルソナを選択しました。
明らかにスパムであるテスト投稿を行いました。わかりやすいスパムです。
ブロックされず、すぐに投稿されました。
テスト機能を使用して投稿 URL をスパムボットに渡したところ、結果は「スパムではありません」と表示されましたが、スキャンログには「SPAM - これは明確な宣伝広告です…」と表示されています。
私の期待としては、結果がスキャンログの SPAM という宣言と一致して SPAM となることでした。そして、例えば、管理者がレビューするために投稿がキューに並べられることでした。
何か見落としている点があれば、どなたか教えていただけますでしょうか?私は専門家ではありませんので、どんなアドバイスでも歓迎します!
ありがとうございます!
Roman
(Roman Rizzi)
2
投稿したユーザーの信頼レベルはいくつですか?AIスパムはTL2以上のユーザーからの投稿をスキップします。
「いいね!」 4
返信ありがとうございます!
投稿に使用したユーザーはTrust Level new userです。
投稿が承認された理由について、何か考えはありますか?
ご協力に感謝いたします!
Roman
(Roman Rizzi)
5
これにより、テストと投稿の両方がフラグ付けされないようになります。
スパム検出器のペルソナシステムプロンプトは、Claudeモデルを混乱させていました。この変更により、期待される応答形式の指示がより明確になります。
「いいね!」 4
素晴らしい!テスト機能は期待どおりに動作しています。
AIスパム機能が、スパム投稿を即座にブロックできない理由について、お手伝いいただけないでしょうか?AIスパムテストに投稿を送信したところ、スパムとしてフラグが立てられましたが、投稿されてしまいました。
何か接続が欠けているのでしょうか?ご協力いただき、誠にありがとうございます!
「いいね!」 1
Jagster
(Jakke Lehtonen)
7
あなたは管理者、または上位のTLですか?もしそうなら、低TLのテストユーザーを使ってみるかもしれません。
「いいね!」 1
Roman
(Roman Rizzi)
8
投稿は以下の場合にスキップされます。
- 投稿者の信頼レベルがTL1より高い場合。
- 投稿がプライベートメッセージトピックに属している場合。
- 投稿者がボットである場合。
- 投稿者がスタッフ(モデレーター/管理者)である場合。
- 投稿者が通常の(PMではない)トピックで3回以上投稿している場合。
- 投稿が既に3回以上スキャンされている場合。
テストが機能している場合、上記いずれかが原因であると確信しています。
「いいね!」 1
ああ、ありがとうございます!忍耐強く、親切なご返信に感謝いたします!
信頼度レベル0のユーザーではなく、管理者ユーザーで投稿してしまいました。
うまくいきました!discourse_ai_spam ユーザーが、投稿をフラグ付けして非公開にしたユーザーとして表示されるのが気に入っています。
この件について、迅速かつ寛大なご支援をいただき、重ねて感謝いたします!
「いいね!」 3