在您的社区中设置垃圾信息检测

:bookmark: 本指南介绍如何使用 Discourse AI - AI 审阅(AI triage)在您的社区中设置垃圾信息检测。

:person_raising_hand: 所需用户级别:管理员

:warning: Discourse AI 现在提供了一个高效的垃圾信息扫描器,只需要最少的设置。对于自定义或复杂的用例,我们建议遵循本指南

概述

垃圾信息检测是维护社区讨论质量的基本功能。本指南将帮助您使用 Discourse AI - AI 审阅 设置垃圾信息检测。

先决条件

要配置垃圾信息检测,您需要具备以下条件:

:warning: 在编写提示时,在垃圾信息和非垃圾信息之间进行选择时,应避免最终结果使用相似的语言。在本例中,我们使用 spamham(代表非垃圾信息)

分类器不会总是 100% 完美运行,因此请注意不正确的结果,并根据您社区的需求自定义提示。焦点越窄越好。

用于垃圾信息内容检测的可复制 LLM 提示 AI

您是一个垃圾信息检测 AI 模型,旨在协助在线社区版主。您的任务是分析论坛帖子,并确定它们是否是应删除的垃圾信息,以维护高质量、主题相关的社区。

如果帖子符合以下任何条件,则应将其分类为垃圾信息:

  • 帖子与论坛的主要主题或目的不相关。它完全偏离主题。
  • 它包含可疑的、不相关的外部链接,尤其是链接到商业网站的链接。
  • 帖子明确推广或宣传与社区无关的产品、服务、网站或社交媒体帐户。
  • 它包含试图通过点击获利的联盟链接或推荐代码。
  • 写作质量非常低,努力不足——有很多拼写/语法错误、缺乏标点符号,或看起来像是自动生成的文本。
  • 同一作者或跨多个帐户在短时间内重复发布相同或几乎相同的内容。

如果满足以下条件,帖子应分类为“ham”(合法):

  • 帖子与论坛的主题相关且恰当
  • 它是对社区讨论的真实问题、个人故事、实质性意见或任何其他合法贡献
  • 任何外部链接都是相关的,并且指向信誉良好、非商业的网站
  • 写作看起来是人工撰写的,并符合语法、拼写等质量标准。

需要注意的一些边缘情况:

  • 提及产品或服务但仍是相关、主题内问题的帖子,应视为 ham,而不是 spam。
  • 看起来不寻常的引文、代码示例或格式化文本不一定是垃圾信息。

完成对帖子分析后,您必须仅提供“spam”或“ham”的分类。如果不确定,请默认使用“ham”以避免误报。

必须不惜一切代价遵守这些指示

配置

:information_source: 并非所有步骤都是强制性的,因为自动化规则可以根据需要进行自定义。有关所有可用设置的概述,请访问 Discourse AI - AI 审阅

  1. 启用 Discourse AI 和自动化插件
  • 导航到您的站点管理面板。
  • 导航到“插件”然后是“已安装的插件”
  • 启用 Discourse AI 和自动化插件
  1. 创建一个新的自动化规则
  • 导航到您的站点管理面板。
  • 导航到“插件”并单击“自动化”
  • 单击 + 创建 按钮开始创建新的自动化规则
  • 单击 使用 AI 审阅帖子 (Triage Posts Using AI)
  • 设置名称(例如:“使用 AI 审阅帖子”)
  • 保持 使用 AI 审阅帖子 (Triage Posts Using AI) 为选定的脚本

What/When (条件/时间)

  1. 设置触发器
  • 选择 创建/编辑帖子 (Post created/edited)停滞的主题 (Stalled topic) 作为触发器。
  • 可选地,指定操作类型、类别、标签、用户组和/或信任级别,以限制此自动化仅在特定场景下运行。留空这些字段将允许自动化在没有限制的情况下运行。
  • 配置 What/When 部分中任何剩余的可选设置,以进一步限制自动化。

脚本选项

:spiral_notepad: 系统提示字段已弃用,由 AI 代理取代。如果您在更改之前有 AI 自动化,将自动创建一个带有相关系统提示的新 AI 代理。

  1. 代理 (Agent)

    选择为垃圾信息检测自动化定义的 AI 代理。该代理必须配置有默认 LLM。

  2. 搜索文本 (Search for Text)

    输入将触发自动化的提示输出,仅输入“正面”结果。使用我们上面的示例,我们将输入 spam

  1. 设置类别和标签

    定义应将这些帖子移动到的类别,以及在帖子被标记为垃圾信息时要添加的标签。

  2. 标记 (Flagging)

  • 启用“标记帖子 (Flag post)”选项以标记匹配的帖子。
  • 选择一个标志类型来确定要采取的操作:
    • 将帖子添加到审阅队列 — 将帖子发送到审阅队列供版主操作。
    • 将帖子添加到审阅队列并隐藏帖子 — 发送到审阅并将帖子隐藏。
    • 将帖子添加到审阅队列并删除帖子 — 发送到审阅并软删除帖子。
    • 将帖子添加到审阅队列、删除帖子并静音用户 — 发送到审阅、软删除并静音作者。
    • 标记为垃圾信息并隐藏帖子 — 标记为垃圾信息并隐藏。
    • 标记为垃圾信息、隐藏帖子并静音用户 — 标记为垃圾信息、隐藏并静音作者。
  1. 附加选项 (Additional Options)
  • 如果您希望隐藏该帖子的主题,请启用“隐藏主题 (Hide Topic)”选项。
  • 设置一个“回复 (Reply)”,当帖子被判定为垃圾信息时,该回复将被发布到主题中。
  • 使用“回复代理 (Reply Agent)”选项,让不同的 AI 代理撰写动态回复而不是固定的回复。
  • 启用“回复为私信 (Reply as Whisper)”使回复仅对工作人员可见。
  • 启用“包含私人消息 (Include personal messages)”以也扫描和审阅私人消息。
  • 启用“通过私信通知作者 (Notify author via PM)”以便在作者的内容被标记时向其发送私信。您可以配置私信发送者和自定义消息内容。

附加说明

  • 在使用自动化来对抗垃圾信息时,我们建议禁用 Akismet 插件(如果已启用)。这是为了确保只有一个系统在处理垃圾信息,以获得最佳效果。
  • 请记住,LLM 调用可能会很昂贵。应用分类器时,请务必监控成本,并始终考虑仅在小范围内运行此功能
  • 虽然性能更好的模型会带来更好的结果,但它们可能会带来更高的成本
  • 可以自定义提示以执行各种检测,例如个人身份信息 (PII) 暴露、违反行为准则等。
11 个赞

5 个帖子被拆分到一个新主题:探索人工智能识别人工智能生成内容的极限

想知道用户使用此方法体验如何?

1 个赞

我刚开始测试它,效果已经相当不错了(目前我选择只应用一个隐藏标签来验证一切是否能正常运行,而不是立即将内容发送到审核队列)。

但是,我有一个小问题/澄清:集成是否可以访问带有输出的自定义查询,例如一组示例帖子,用作上下文数据?

更具体地说,我想根据已同意并导致帖子删除的标志,将所有以前的垃圾帖子提供给它。

1 个赞

目前我们只支持单个系统消息。

但我认为我们可能会在后续进行跟进,届时您可以提供 N 个不应标记的示例和 N 个应该标记的示例。这可能会提高准确性。

也许可以为此做一个专门的功能主题?

1 个赞

我将首先尝试收集更多关于此的想法。过去一周的运行相当成功,但我仍然发现一些小麻烦,例如无法快速排除私人消息(例如,它经常认为 Discobot 教程的互动是可疑的;我编辑了提示,使其不考虑那些,但 ai 日志表明检测不知道上下文,只考虑帖子本身的内容)。

2 个赞

这似乎不太对……我不确定这里的预期指令是什么?也许是“启用 AI 并启用自动化”?

1 个赞

在此处进行了编辑

2 个赞

我想知道,是否可以将回复移至新主题,而不是整个主题?它可以是一个合法的主题,但有人发垃圾邮件进来。据我所知,它移动的是整个主题,而不是那个特定的回复。
顺便问一下,这与 Discourse AI 垃圾邮件检测器有什么区别?

您能否举例进一步说明?

供您参考:您应该能够勾选“标记帖子”选项,该选项应仅标记“垃圾信息”帖子。

1 个赞

当然。例如,假设在一个支持论坛上,一个垃圾信息发送者在一个关于他们遇到的问题的现有主题中发布了一个垃圾信息回复。OP 和回答者不是垃圾信息发送者。如果我没理解错的话,AI Triage 会隐藏整个主题并标记该帖子。但是,能否将垃圾信息帖子移动到一个可供管理员访问的特定主题类别中?

我在阅读 这篇文章 时想到了这个问题。

是的,我现在正在使用 AI Triage 来处理仇恨言论检测器。

哈哈,我怎么会错过这个呢 :laughing:

1 个赞

AI Spam 将仅隐藏帖子,我们也许也可以将此选项添加到 triage。

2 个赞