こんにちは、
マデイラ島の多言語ビジネスディレクトリである「madeira.community」で、コンテンツモデレーション用の「AI を使用したトリアージ投稿」自動化を設定しました。
この自動化は公開投稿では完璧に機能しています。しかし、「個人メッセージを含める」オプションを有効にしたところ、一般ユーザー間のダイレクトメッセージ(DM)が全くスキャンされていないことが分かりました。
私の懸念は深刻です。悪意のある行為者が、公開コンテンツでは正常に機能している AI モデレーションを完全に回避しながら、薬物取引、窃取された金融データの共有、児童誘拐などの違法行為を私的メッセージで行う可能性があります。
私の質問:
-
「個人メッセージを含める」オプションは、一般ユーザー(スタッフではない)同士の DM スキャンを実際にサポートしていますか?
-
もしサポートしていない場合、これは設計上の意図によるものですか、それとも既知の制限事項ですか?
-
一般ユーザー間の私的メッセージに対して AI トリアージを適用できるサポートされた方法はありますか?
「デフォルトで LLM トリアージにおける PM スキャンをスキップする」というコミットへの言及を見つけましたが、これは意図的なものである可能性があります。しかし、UI にそのオプションが存在するため、実際に何をしているのか混乱しています。
ありがとうございます