重複とスパム/有害行為の組み合わせを報告する投稿

最近AIを使い始めたため、設定を見落としている可能性があります。
Google Perspective APIの廃止が前倒しになったため、ずっと避けてきたAI実装に移行しました。

スパムと有害性の両方が機能していますが、同じ投稿がスパムと有害性の両方としてフラグ付けされています。これは正常で予期された動作でしょうか?

用語に関するフィードバック:「Flag rejected」(フラグ拒否)という表現は、AI適用フラグのコンテキストでは紛らわしいです。投稿が拒否されたのか、それとも最初のAIフラグが拒否されたのでしょうか?

「いいね!」 2

スパム検出ペルソナ(事前設定済み)と有害性ペルソナの両方を使用する別の例を追加します。

この投稿はスパムと有害の両方としてトリガーされ、非常に異なる応答オプションと結果を持つ2つのフラグが立てられたエントリが生成されます。

質問: ほとんどすべての非公開フォーラムでスパムと有害な投稿の両方の防止が必要になる可能性が高いことを考えると、スパムと有害性のペルソナを1つの事前設定されたペルソナに結合することは理にかなっていますか?

1つの投稿、2つのフラグ

この投稿はスパムですか? はい

この投稿はスパムですか? いいえ

この投稿を承認しますか? はい(オプションなし)またはいいえ

「いいね!」 1

Samも同様の提案をしていたようですが、それを見逃していました。

この件についてさらに時間をかけて検討した結果、Toxicity Triage Persona(毒性トリアージペルソナ)に適切な調整を加えることができれば、二重フラグ(スパムと有害性)を減らせる可能性があります。私の経験では、スパマーよりも新規ではないメンバーの方が有害性が発生しやすい傾向があります。

そうは言っても、以下について検討することが適切だと考えます。

についても検討する価値があります。

また、スパムと有害性を組み合わせる、あるいは有害性をスパムモジュールのように含めることは、妥当な機能リクエストおよび議論であると思われるため、Topics tagged ai に移動します。

「いいね!」 1