Expériences avec la modération basée sur l'IA sur Discourse Meta

En regardant la différence entre ces invites :

Évaluez TOUS les messages, si un message ne nécessite aucune modération, utilisez la priorité d’ignorance.

Évaluez TOUS les messages avec un œil sceptique. N’utilisez la priorité « ignorer » que pour les contributions ayant une valeur claire et authentique. En cas de doute sur la valeur ou l’authenticité d’un message, attribuez au moins une priorité « faible » pour un examen humain.

Je pense qu’il est important de se rappeler le biais de récence majeur dans les modèles - peut-être que tous les mots de commande devraient être mentionnés dans une prose vers la fin, dans l’ordre inverse de la fréquence souhaitée.

1 « J'aime »