El entropía mínima es un término confuso

Admito mi ignorancia aquí, pero cada vez que quiero relajar las reglas sobre caracteres únicos en títulos y contenido de publicaciones, me atasco en las descripciones de la configuración de body min entropy y title min entropy:

La entropía mínima (caracteres únicos, recuento de no ingleses, etc.) requerida para el cuerpo de una publicación.

Debería haber una forma de expresarlo en un lenguaje más humano. Al mirar el código (discourse/lib/text_sentinel.rb at 63ca30ccb415d133c65aee6758b7f34d9705eea7 · discourse/discourse · GitHub), no estoy seguro de qué sugerir. Si la configuración tomara una escala real, digamos de 1 a 10, sería más fácil de explicar.

Siéntete libre de cerrar esto si hay otros temas que traten el problema.

7 Me gusta

Hay más lenguaje humano en la alerta de si el título de un tema no está permitido, pero esto no está claro en cuanto a cuál es el requisito para un título.

Alerta:

No sabía sobre esa configuración, parece relativamente claro que el número de caracteres diferentes necesarios es lo que se puede ajustar.

3 Me gusta

Es complicado, porque la configuración describe un algoritmo, sin proporcionar suficiente información para que quede claro cómo funciona el algoritmo. Pero sí, básicamente dice “de 0 a (?), ¿cuánta variación se requiere en los títulos y el contenido de las publicaciones?”.

3 Me gusta

Sé lo que significa entropía, pero usar esa configuración fue una experiencia horrible. Sin importar los valores que probé, me molestaba constantemente. La configuración en sí es necesaria, quizás, pero como soy miembro de una familia lingüística muy pequeña y muy extraña, el finés, y usamos muchas vocales y estas pueden ser largas, y lo mismo con las consonantes, puse cero en ellas.

De nuevo. Mi foro está prácticamente libre de spam y es para gente adulta normal, así que ni siquiera lo necesito. Supongo que la situación no es tan soleada en todas partes. Pero puedo ver por qué parece tan confuso.

4 Me gusta

Debería ser un tema separado, pero cómo configurar Discourse para adultos es exactamente en lo que estoy trabajando en este momento.

5 Me gusta

Bueno, por supuesto, depende de si un foro está dirigido a nórdicos, italianos, sudamericanos (perdón por la generalización), EE. UU. (gran generalización aquí), académicos, jugadores, derecha, izquierda… pero me gustaría decir que hay pocas reglas universales:

  • Demasiada decoración y trucos son simplemente demasiado
  • Los problemas de spam solo deben resolverse si hay necesidad de ello
  • Los usuarios deben obtener los derechos que necesitan de inmediato, así que no jueguen con los niveles de confianza
  • Expulsa a las manzanas podridas de inmediato de los foros, sin advertencias
  • La gamificación es solo otro truco

Y parte de eso es no usar configuraciones de entropía.

4 Me gusta

Esta es una segunda alerta que he visto y que puede ser útil para asegurar que las personas escriban oraciones completas:

Sin embargo, no hay forma de responder a esta pregunta, el sistema prohíbe la publicación de la entrada a menos que haya más entropía, lo cual no se explica al escritor.

Con el límite mínimo de caracteres para los títulos, agregar algunos asteriscos cumple ese límite, pero este requisito adicional de entropía podría desarrollarse un poco más.

1 me gusta

Mi estrategia es tener una aprobación manual de las primeras publicaciones para filtrar spam y otro contenido de baja calidad. Todos los demás límites, como el recuento de caracteres, la entropía y toda esta otra basura, interfieren con la interacción de las personas en el sitio, por lo que está desactivado (o al menos configurado en un umbral extremadamente tolerante).

Hasta ahora, hemos detectado el 100% del spam y ningún usuario tiene que sufrir un mensaje vago sobre cómo su publicación necesita más caracteres (lo que irónicamente probablemente promueve el spam. Porque para evitar el mensaje, la forma más sencilla es simplemente agregar ruido de caracteres hasta que se supere el umbral).

1 me gusta

La descripción “Número mínimo de caracteres únicos” me parece bastante clara. No creo que necesites un cambio aquí, especialmente dado que es un ajuste muy menor. (sin embargo, ese comentario de NLS podría ser un poco confuso, ¿significa que cuenta un carácter nacional según el número de bytes UTF8 que tiene?)

1 me gusta