Discourse MetaにおけるAIベースのモデレーション実験

これらのプロンプトの違いを見ると:

「すべての投稿を審査し、モデレーションが不要な場合は無視の優先度を使用してください。」

「すべての投稿を懐疑的な目で審査してください。明確で本物の価値がある貢献に対してのみ「無視」の優先度を使用してください。投稿の価値または信憑性について疑わしい場合は、人間のレビューのために少なくとも「低」の優先度を割り当ててください。」

モデルにおける大きな最近性バイアスを覚えておくことが重要だと思います。おそらく、すべてのコマンドワードは、望ましい頻度の逆順で、最後に文章で言及されるべきです。

「いいね!」 1