最小熵是一个令人困惑的术语

我承认自己在这方面很无知,但每次我想放宽标题和帖子内容中关于唯一字符的规则时,我都会卡在 body min entropytitle min entropy 设置的描述上:

帖子正文所需的最小熵(唯一字符、非英语字符计数等)。

应该有一种更通俗易懂的说法。看了代码 (discourse/lib/text_sentinel.rb at 63ca30ccb415d133c65aee6758b7f34d9705eea7 · discourse/discourse · GitHub),我不知道该如何建议。如果该设置采用实际的量表,例如 1-10,会更容易解释。

如果存在其他处理此问题的讨论主题,请随时关闭此问题。

7 个赞

警报中关于不允许主题标题的说明包含更多的人类语言,但标题的要求并不明确。

警报:

不知道有这个设置,这似乎相对清楚,可以调整所需不同字符的数量。

3 个赞

这很棘手,因为该设置描述了一个算法,但没有提供足够的信息来清楚地说明该算法的工作原理。但是的,它基本上是在说“从 0 到 (?),标题和帖子内容需要多少变化量。”

3 个赞

我知道熵的意思,但使用那些设置简直是一次糟糕的体验。无论我尝试什么值,它都在不停地唠叨。也许设置本身是需要的,但因为我是非常小的、非常奇怪的语系——芬兰语——的一员,我们使用大量的元音,而且这些元音可能很长,辅音也是如此,所以我把它们都设为零。

再说一遍。我的论坛几乎没有垃圾邮件,而且是给正常的成年人使用的,所以我甚至不需要它。我猜情况并非到处都如此乐观。但我明白为什么它看起来如此令人困惑。

4 个赞

这应该是一个单独的主题,但目前我正在研究如何为成年人配置 Discourse。

5 个赞

当然,这取决于论坛是针对北欧、意大利、南美(抱歉泛化)、美国(这里是很大的泛化)、学者、游戏、右翼、左翼……但我想说有一些普遍规则:

  • 过多的装饰和噱头就是太多了
  • 垃圾邮件问题应该在有需要时解决
  • 用户必须立即获得他们需要的权利,所以不要玩弄信任等级
  • 立即将害群之马踢出论坛,无需警告
  • 游戏化只是另一个噱头

其中一部分是不使用熵设置。

4 个赞

这是我看到的第二个警报,这有助于确保人们写完整的句子:

但是,没有办法回答这个问题,系统禁止发布帖子,除非有更多的熵,而这一点没有向作者解释。

由于标题的最小字符限制,添加几个星号可以满足该限制,但这种额外的熵要求可以更完善一些。

1 个赞

我的策略是手动批准最初的几篇帖子,以过滤掉垃圾邮件和其他低质量内容。所有其他限制,如字符数和熵以及所有这些其他无关内容,都会阻碍人们与网站互动,因此它们被关闭了(或者至少被设置为一个非常宽容的阈值)。

到目前为止,我们已经捕获了 100% 的垃圾邮件,并且没有用户不得不忍受关于他们的帖子需要更多字符的模糊消息(讽刺的是,这可能会促进垃圾邮件。因为要绕过消息,最简单的方法就是添加字符噪音直到达到阈值)。

1 个赞

“最小唯一字符数”的描述对我来说很清楚——我认为你不需要在这里做任何改动,尤其考虑到这是一个非常小的调整。(不过,那个NLS注释可能有点令人困惑,它的意思是它将一个国家字符计为其拥有的UTF8字节数吗?)

1 个赞