Experimentos con moderación basada en IA en Discourse Meta

Observando la diferencia entre estas indicaciones:

Juzga TODAS las publicaciones, si una publicación no requiere moderación usa la prioridad de ignorar.

Juzga TODAS las publicaciones con ojo escéptico. Usa la prioridad de “ignorar” solo para contribuciones con valor claro y auténtico. Cuando dudes del valor o autenticidad de una publicación, asigna al menos una prioridad “baja” para revisión humana.

Creo que es importante recordar el importante sesgo de recencia en los modelos: quizás todas las palabras de comando deberían mencionarse en prosa cerca del final, en orden inverso de frecuencia deseada.

1 me gusta