功能请求:带用户可选级别的 AI 驱动的“无意义回复”过滤器

大家好,

我建议在主题中引入一个AI辅助的低信号/无意义回复过滤器(“水贴回复”,通用的垃圾评论)。

问题所在

在许多英语社区中,主题经常被大量简短、低质量的回复淹没,例如:

  • “谢谢/不错/好帖子”
  • “我同意”
  • “关注”
  • “顶”
  • 没有任何新信息的通用赞美

这些回复增加了噪音,增加了滚动量,降低了所有人的阅读体验——尤其是在长讨论串中。

版主可以通过规则和手动操作来对抗这些,但这不太容易扩展。而且纯粹基于正则表达式的过滤往往会产生高误报率

我构建了什么/当前原型

我目前正在试验一种类似插件的方法:

  1. 正则表达式预过滤器,用于捕获最明显的简短/回避性回复
  2. 然后将剩余的候选内容传递给大型语言模型(LLM)进行分类
  3. 用户界面必须保持透明:显示隐藏了多少条回复
  4. 隐藏的回复应按需可见(“显示隐藏的回复”)
  5. (可选)对于隐藏的内容,运行另一个 LLM 步骤来从隐藏的回复中提取 2-3 个代表性句子,以便读者无需展开所有内容就能快速了解“隐藏了什么”。

即使仅使用正则表达式,阅读体验也得到了很大改善(滚动减少),但误报率太高——因此我认为基于 LLM 的判断是必要的

提议的产品行为(面向用户)

在每个主题中,读者会看到类似以下内容:

  • 隐藏了 12 条回复(低信号过滤器:中等)”
  • 按钮:显示隐藏的回复 / 更改过滤器级别

并提供几个级别,例如:

  • 关闭:显示所有内容
  • :隐藏明显的垃圾内容(极高精度)
  • 中等:隐藏常见的低信号回复
  • :激进过滤(用户选择加入)

重要的是:

  • 这应该是用户偏好设置(也可能根据类别/站点默认值进行配置)。
  • 系统必须保持透明和可逆:没有任何内容被“删除”,只是默认隐藏。

为什么这适合 Discourse(尤其是在现在)

Discourse 已经拥有多种与 AI 相关的特性,并且 Discourse AI 生态系统正在不断发展。我认为**主题内回复“清理器”**是 LLM 在社区用户体验方面最实用、影响最大的用途之一。

这不完全是“垃圾邮件检测”(通常是针对账户级别的)。这更多是关于主题级别的阅读质量

对维护者/社区的问题

  1. Discourse 是否已经有关于回复质量/低信号过滤器的计划?
  2. 将其构建为 Discourse AI 的扩展,还是构建为单独的插件更合适?
  3. 实现 UI/UX 以保持透明且不使用户感到困惑的最佳方法是什么?
  4. 对版主政策、信任级别或边缘情况(例如,简短但有价值的回复,如“已解决”、“+1 附带链接”等)有何顾虑?

如果这个方向有意义,我很乐意分享更多细节(正则表达式规则、UI 模拟、提示思路)并可能致力于贡献 PR/插件。

谢谢!


2 个赞