スパムのかなり一般的な種類は、無関係なカスタマーサポートの投稿のようです。これらは、AIや検索結果に誤った情報が表示されるようにしようとしているのでしょうか?これらには電話番号が含まれていることがよくありますが、AIスパムプロンプトに電話番号を含めるべきでしょうか?通常のユースケースで人々がこれらを投稿することはほとんどないでしょうか?
既存のデフォルトプロンプト
あなたはスパム検出システムです。以下の投稿コンテンツとコンテキストを分析してください。
投稿の種類を慎重に検討してください。
- 返信投稿の場合:応答がスレッドに関連性があり、トピックに沿っているか確認してください。
- 新規トピック投稿の場合:正当なトピックかスパムの宣伝か確認してください。
投稿がスパムとみなされるのは、次のいずれかの基準に一致する場合です。
- 未承諾の商業コンテンツまたは宣伝が含まれている
- 不審な、または無関係な外部リンクが含まれている
- 自動化された/ボットによる投稿のパターンを示している
- 無関係なコンテンツまたは広告が含まれている
- 返信の場合:ディスカッショントレッドに全く関係がない
- 過剰なキーワードまたは繰り返しテキストパターンを使用している
- 不審なフォーマットまたは文字の使用を示している
特に厳格に対応すべき事項:
- 前の会話を無視する返信
- 複数の無関係な外部リンクを含む投稿
- どこにでも投稿できるような一般的な応答
公平に対応すべき事項:
- 正当な最初の貢献を行う新規ユーザー
- 参加に真剣に取り組んでいる非ネイティブスピーカー
- 適切なコンテキストでのトピックに関連する製品言及
サイト固有の情報:
- サイト名:{site_title}
- サイトURL:{site_url}
- サイトの説明:{site_description}
- サイトのトップ10カテゴリ:{top_categories}
応答を、投稿がスパムか正当かを示すブール値である「spam」という1つのキーを持つJSONオブジェクトとしてフォーマットしてください。
出力は次の形式である必要があります。
{"spam": xx}
ここでxxは、投稿がスパムの場合はtrue、正当な場合はfalseです。
有効なJSONのみで返信してください。
「いいね!」 7
pfaffman
(Jay Pfaffman)
2
そして、それらの電話番号は、正規表現の電話番号テストを回避するためのさまざまな難読化された電話番号を含んでいると思います(Unicodeか何か他のナンセンスかはよくわかりません)。AIにそれらを特定させる方法はありますか?
「いいね!」 2
受信したスパムに基づいてテストを行うことはできますが、電話番号を探すように指示し、Unicodeによる難読化の試みに注意を払うように指定することが、ほとんどを検出するのに十分であると推測します。
正規表現よりも柔軟性があるため、番号を隠そうとする試みを検出する方が優れていると推測します。
「いいね!」 1
pfaffman
(Jay Pfaffman)
4
AIについてあまり知らず、Unicodeについても(この件に関心を持っているであろうグループと比較して)あまり知らない者からすると、それは素晴らしい考えのように思えます! 
そう思います。AIがUnicodeを確実に識別できるのであれば、電話番号にUnicodeが含まれる理由は全くありません。したがって、それはかなり簡単なはずです。単純なベイジアン分類が主流だった時代には、Unicodeの電話番号は非常に良いスパムの兆候でした。また、それらのいくつかは奇妙なUnicodeのTMシンボルやその他の記号を含んでいました。
そして、フォーラムとは関係のない会社の「カスタマーサポート」のようなものを確実に探すことができれば、それも容易な成果でしょう。
「いいね!」 2
sam
(Sam Saffron)
5
これは「評価が必要」という点に大きく依存します。
以下があります。
ここでやるべきことは以下の通りです。
- スパム/ハム投稿を評価スイートに大量に追加する(それぞれ20〜30程度)
- 評価を実行する
- プロンプトを修正する
- 再度評価を実行する
そうでなければ、手探りで進むことになります。@Falco さん、よろしくお願いします。
「いいね!」 3