Discourse AI - スパム検出

jordan-violet · 2025 年 2 月 14 日午後 6:59

これをかなりテストしましたが、信頼できる結果はまったく得られませんでした。参考までに、gpt-4o モデルを使用しています。

精度をテストするために、次の簡単な指示を与えました。

あなたはスパム検出システムです。以下のコンテンツとコンテキストを分析してください。
以下のメモを参照してください。以下の項目のいずれか一つでも真実であれば、スパムとしてマークしてください。
- ユーザー名が具体的に「testjon」である場合、それは*常に*スパムです。
- 「SPAM - It's Jon!」または「NOT SPAM」のみで応答してください。

ユーザー名 testjon で投稿をテストした結果は NOT SPAM でした。指示がまったく守られていないようです。何か提案はありますか？

AIスパム検出に関して、他に良い経験や悪い経験をした人はいますか？

トピック		返信	表示
Setting up spam detection in your community Site Management moderation , automation , how-to , ai	10	2101	2025 年 1 月 30 日
AI powered Spam detection Announcements ai , spam	11	1147	2025 年 1 月 11 日
AI spam bot says it is not spam but scan log says it is spam Bug ai	7	268	2025 年 8 月 22 日
Are you experiencing AI based spam? Community Building ai	22	2302	2025 年 1 月 19 日
Discourse AI to make spam filter smarter? Feature completed , ai	1	496	2024 年 5 月 18 日

Discourse AI - スパム検出

関連トピック