大家好,
我建议在主题中引入一个AI辅助的低信号/无意义回复过滤器(“水贴回复”,通用的垃圾评论)。
问题所在
在许多英语社区中,主题经常被大量简短、低质量的回复淹没,例如:
- “谢谢/不错/好帖子”
- “我同意”
- “关注”
- “顶”
- 没有任何新信息的通用赞美
这些回复增加了噪音,增加了滚动量,降低了所有人的阅读体验——尤其是在长讨论串中。
版主可以通过规则和手动操作来对抗这些,但这不太容易扩展。而且纯粹基于正则表达式的过滤往往会产生高误报率。
我构建了什么/当前原型
我目前正在试验一种类似插件的方法:
- 正则表达式预过滤器,用于捕获最明显的简短/回避性回复
- 然后将剩余的候选内容传递给大型语言模型(LLM)进行分类
- 用户界面必须保持透明:显示隐藏了多少条回复
- 隐藏的回复应按需可见(“显示隐藏的回复”)
- (可选)对于隐藏的内容,运行另一个 LLM 步骤来从隐藏的回复中提取 2-3 个代表性句子,以便读者无需展开所有内容就能快速了解“隐藏了什么”。
即使仅使用正则表达式,阅读体验也得到了很大改善(滚动减少),但误报率太高——因此我认为基于 LLM 的判断是必要的。
提议的产品行为(面向用户)
在每个主题中,读者会看到类似以下内容:
- “隐藏了 12 条回复(低信号过滤器:中等)”
- 按钮:显示隐藏的回复 / 更改过滤器级别
并提供几个级别,例如:
- 关闭:显示所有内容
- 低:隐藏明显的垃圾内容(极高精度)
- 中等:隐藏常见的低信号回复
- 高:激进过滤(用户选择加入)
重要的是:
- 这应该是用户偏好设置(也可能根据类别/站点默认值进行配置)。
- 系统必须保持透明和可逆:没有任何内容被“删除”,只是默认隐藏。
为什么这适合 Discourse(尤其是在现在)
Discourse 已经拥有多种与 AI 相关的特性,并且 Discourse AI 生态系统正在不断发展。我认为**主题内回复“清理器”**是 LLM 在社区用户体验方面最实用、影响最大的用途之一。
这不完全是“垃圾邮件检测”(通常是针对账户级别的)。这更多是关于主题级别的阅读质量。
对维护者/社区的问题
- Discourse 是否已经有关于回复质量/低信号过滤器的计划?
- 将其构建为 Discourse AI 的扩展,还是构建为单独的插件更合适?
- 实现 UI/UX 以保持透明且不使用户感到困惑的最佳方法是什么?
- 对版主政策、信任级别或边缘情况(例如,简短但有价值的回复,如“已解决”、“+1 附带链接”等)有何顾虑?
如果这个方向有意义,我很乐意分享更多细节(正则表达式规则、UI 模拟、提示思路)并可能致力于贡献 PR/插件。
谢谢!