敏感词参考指南

:bookmark: 这是一份 #参考指南,用于说明“受监视词汇”(Watched Words)页面的功能,以及您可以在 Discourse 站点上用于屏蔽特定词汇的不同操作类型。

:person_raising_hand: 所需用户等级:管理员

了解受监视词汇

您可以设置“受监视词汇”,使其根据主题或帖子中发现的词汇执行相应操作(位于 .../admin/customize/watched_words)。

每种操作类型最多可包含 2000 个词汇。

在所有操作中,* 可作为通配符使用,并且可以选择受监视词汇是否区分大小写。

默认情况下,受监视词汇是隐藏的。勾选“显示词汇”复选框将显示这些词汇并允许您删除它们。使用搜索字段也会显示任何匹配的词汇。

可以使用 “从文件添加” 按钮批量上传受监视词汇列表,并且可以使用 “下载” 按钮从 Discourse 下载任何操作类型的受监视词汇列表。批量上传受监视词汇所需的文件格式为 CSV。

批量上传的 CSV 格式

CSV 文件按操作类型上传——文件本身没有操作类型列。所有操作类型的格式相同:最多三列。

内容 说明
1 单词或短语 所有操作类型均必需
2 替换值 替换链接标签 操作类型必需——缺少此值的行将被跳过。其他所有操作类型均忽略此列。
3 大小写敏感性 所有操作类型均为可选。确切字符串 true 启用大小写敏感性;任何其他值,或空白/缺失的列,则表示不区分大小写。TRUETrue 也可接受。

示例:

badword
another bad phrase
*wildcard*
CaseSensitiveWord,,true
oldword,newword
colour,color
DontTouchThis,leave it alone,true

:information_source: 有几件事值得注意:

  • “下载” 按钮 不会 导出大小写敏感性设置。如果您下载列表并重新上传,除非在重新导入前手动在第三列添加 true,否则所有词汇将恢复为不区分大小写。
  • 词汇和替换值的长度均限制为 100 个字符
  • 如果词汇或替换值中包含逗号,请用双引号将其括起来——适用标准 CSV 引用规则(例如 "hello, world",replacement)。

所有操作还有一个 “测试” 按钮,可用于测试特定单词或短语是否包含任何受监视词汇。

匹配到的受监视词汇短语示例

无匹配项的短语示例

操作类型

“受监视词汇”页面允许您对匹配的词汇执行以下类型的操作:

:information_source: 一个受监视词汇只能存在于一个操作类型列表中。如果将重复词汇添加到第二个列表中,它将从之前的列表中移除。

屏蔽

阻止包含这些词汇的主题或帖子在提交时发布,方法是屏蔽整个主题/帖子。用户尝试提交帖子时将看到错误消息。

工作人员帖子(管理员和版主)不会被受监视词汇屏蔽。

审查

允许包含这些词汇的帖子,但用隐藏被审查词汇的字符替换这些词汇。被审查的词汇将被替换为方块。(例如:■■■■■■■■)

需要审批

包含这些词汇的帖子需要工作人员审批后才能被看到。提交包含具有此操作类型词汇的帖子时,该帖子将被隐藏,直到工作人员审查它。

工作人员帖子(管理员和版主)不会被扫描以检查需要审批的词汇。

标记

允许包含这些词汇的帖子,但对其进行标记,以便版主可以审查。包含标记词汇的帖子将正常显示,但会被提交以供审查。审查员将拥有多种选项:

如果他们隐藏该帖子,它仍然可见,但外观如下:

点击“查看被忽略的内容”链接将显示完整内容,但仍处于“帖子已隐藏”状态。

如果他们选择“保留帖子”或从选项中选择“不同意”,帖子将如下所示:

工作人员帖子(管理员和版主)不会被扫描以检查标记词汇。

:information_source: 您还可以使用 基于词汇的帖子标记自动化 在创建/编辑包含特定词汇的主题时对其进行标记。

链接

用链接替换帖子中的词汇。更常用于将常见词汇替换为指向特定主题或外部 URL 的链接,而不是审查词汇。

如果向此类型的操作添加词汇时未选择链接 URL,Discourse 站点的主页将自动用作替换该词汇的链接。

image

替换

用其他词汇替换帖子中的词汇。

如果向此操作添加词汇时未选择替换词汇,该词汇将从帖子中移除,但不会有新词汇取而代之——该词汇将从帖子中消失,帖子将被允许提交(不推荐)。

image

替换操作类型还有一个 “在替换中输出 HTML” 复选框选项。

功能 允许管理员在设置替换文本时使用 HTML 格式,这对于创建链接和为自动替换的文本添加样式强调特别有用。

:warning: 不建议通过受监视词汇进行链接重映射,这可能会造成比预期更多的麻烦。因此,通过受监视词汇 → 替换设置进行链接重映射的功能被故意禁用,无论受监视词汇设置如何,链接都 不会 在主题或帖子中被重映射。

标签

根据主题中的首帖自动用这些词汇为主题添加标签。此操作中包含的每个词汇都可以添加一个或多个标签。

image

提交具有此类型操作的词汇时,必须 包含一个标签,否则会收到错误。

另请注意,当使用受监视词汇为主题添加标签时,该词汇必须在主题发布时包含在主题中,主题才能被正确标记。在创建包含用于标签的受监视词汇的主题后对其进行编辑,不会 将标签添加到该主题。

静默

包含这些词汇的用户首帖需要工作人员审批后才能被看到,并且该用户将被自动静默。在首帖中使用“静默”词汇的用户将被静默,该帖子将被发送到审核队列。

正则表达式

有关在受监视词汇中使用正则表达式的信息,请参阅:

受监视词汇与 AI 分类

除了通过受监视词汇手动配置操作外,Discourse 还可以与 AI 工具集成,以帮助自动化和优化社区中的审核工作。通过使用 Discourse AI - AI 分类 功能,您可以设置 毒性检测NSFW 检测,以增强您识别和处理问题内容的能力。

有关完整的设置说明,请访问:

个人消息中的受监视词汇

“标记”类型的受监视词汇将在个人消息(PM)中触发。有关其工作原理的详细信息,请参阅 上文相关部分

Discourse 聊天中的受监视词汇

当启用 Discourse 聊天 时,某些受监视词汇类型也可以在聊天频道中工作。每种类型与聊天的兼容性如下:

受监视词汇类型 在聊天中有效?
屏蔽 :white_check_mark:
审查 :white_check_mark:
需要审批 :cross_mark:
标记 :cross_mark:
链接 :white_check_mark:
替换 :white_check_mark:
标签 :cross_mark:
静默 :cross_mark:

这些受监视词汇适用于聊天中的所有消息,无论它们是在频道中还是用户之间的直接消息中。

8 个赞

在此处做个笔记,将指南更新为新的“在替换中输出 HTML”选项,该选项允许对替换进行一些巧妙的格式设置,以及像 \u003cabbr\u003e 这样的链接。

4 个赞

如果能够做到以下几点就太好了:

  1. 给链接的单词附加一个 CSS 类,以便可以针对不同的布局(目前无法区分用户自定义的链接和自动链接的单词)
  2. 提供一个选项,只链接单词的第一个实例,而不是帖子中的每个实例
1 个赞

值得一提的是,某些“监视词”类型也适用于聊天。

我认为它们是:

监视词类型 是否适用于聊天?
阻止 :white_check_mark:
审查 :white_check_mark:
需要批准 :cross_mark:
标记 :cross_mark:
链接 :white_check_mark:
替换 :white_check_mark:
标签 :cross_mark:
静默 :cross_mark:
2 个赞

有一个“添加”按钮,但我似乎无法使用它 :frowning:

为什么?

我能够从 UI 中删除一个已关注的单词(quickbooks)。为什么我不能把它加回去?

1 个赞

您是否在“单词或短语”字段中输入了单词?
我有时会感到困惑,因为我忘记了这是我需要添加单词以激活添加按钮的字段。

4 个赞

:persevere:

我没有意识到“包含单词或短语”输入是一个文本输入。事实上,它(显然)预先填入了“单词或短语”,末尾的 + 让我完全摸不着头脑。

谢谢 @Moin

3 个赞

我很高兴不是只有我一个人没意识到这是输入框。也许哪位@版主可以把它移到一个#ux话题下。

2 个赞

我发现“监视词”功能存在一个问题。

例如,如果我添加 test 作为监视词:

  • 短语 hello test world 将被匹配 :white_check_mark:
  • 短语 你 test 好 也将被匹配 :white_check_mark:
  • 但短语 你test好 被匹配 :cross_mark:

看起来“监视词”仅在关键字由空格或标点符号分隔时才有效。这会导致它在关键字紧邻其他字符的情况下失败,而这种情况在中国或日本等语言中非常常见(这些语言的单词之间没有空格)。

您能否确认这是否是一个错误?如果是,那么改进“监视词”功能,使其即使在单词紧邻其他字符时也能匹配,那将是非常棒的。

谢谢!

1 个赞

我认为这不是一个 bug。一切似乎都按预期工作。如果默认情况下忽略空格,并且 ass 是一个被监视的词,那么 passkey 就会触发它。我认为你可以改用 *test* 作为被监视的词,它将适用于你所有的三个例子。

3 个赞

为什么我加了需要审批的关注词:“垃圾话”后,发帖子仍然没有要求被审核?还需要满足别的要求吗?

用您尝试发布的内容测试被监视的词语是否有效?也许您需要像您帖子上方讨论的那样,在词语周围加上星号,以防词语周围没有空格。

谁发布的?您是使用管理员还是版主帐户进行测试的?工作人员撰写的帖子不会被排队等待批准,因为他们无论如何都可以批准自己的帖子。

1 个赞

大家好,

我在我们的健康论坛上遇到了“监视词”(替换)的问题,想知道是否有人找到了解决方案。

问题: 我们使用“监视词”自动展开医学缩写以提高可访问性(例如,MGUSMonoclonal gammopathy of unknown significance (MGUS))。这在初始帖子中运行完美,但当任何人稍后编辑该帖子时,替换会再次运行并创建如下嵌套递归:

Monoclonal gammopathy of unknown significance (Monoclonal gammopathy of unknown significance (MGUS))

每次后续编辑都会增加一层 :melting_face:

我尝试过的方法:

  • 在缩写周围添加单引号:(术语)('术语') - 仍然递归

  • 使用启用了“在替换中输出 HTML”的 HTML 实体 - 编辑时文本完全消失

  • HTML span 标签 - 显示为字面代码并仍然递归

我知道我可以只从替换文本中删除缩写,但为了论坛内部搜索和外部 SEO 的可搜索性,缩写在帖子中保持可见非常重要。缩写是大多数人谈论这些病症的方式,如果我们只显示展开后的术语,这些搜索将无法找到相关的讨论。

所以,我的问题是,是否有办法在不产生递归的情况下展开缩写,同时保持缩写可见以供搜索?

1 个赞

看起来是富文本编辑器中的一个错误,该错误应在以下链接中修复:

2 个赞

感谢 @zogstrip - 我需要对这次更新做些什么吗?因为不幸的是,它仍然在我们的论坛上发生着 :melting_face:

1 个赞

请再试一次,我刚刚部署了您的实例以获取最新版本。

2 个赞

@zogstrip,谢谢!这似乎解决了问题——太棒了。这困扰我太久了 :slight_smile:

1 个赞