No puedo encontrar información específica sobre esto.
Cuando se marcan automáticamente las publicaciones tóxicas (algo que quiero, porque quiero que mi comunidad sea respetuosa y segura), es demasiado sensible, marcó una publicación donde alguien llamó “tonto” a un episodio de televisión.
Estaba configurado en 80. Acabo de aumentarlo a 90. Pero no hay documentación sobre cuál es el máximo (imagino que es 100) y qué debo configurar exactamente para que no genere falsos positivos súper simples pero aún así proteja a mi comunidad.
Hola @Shauny, hemos recibido informes de que el proveedor actual del módulo de toxicidad en el plugin Discourse AI es, de hecho, demasiado sensible para la mayoría de las comunidades.
Para abordar ese problema, acabamos de hacer posible el uso de los nuevos modelos de lenguaje grandes como clasificadores para marcar contenido, lo que brindará a los administradores de la comunidad los medios para personalizar la sensibilidad de la marcación a la que sea apropiada para sus comunidades.
Aún no tenemos una guía para esta flamante función, ya que estamos trabajando en ella, pero te avisaré aquí cuando tengamos una para compartir.