Hope Watched words 增加了对非英文字符的支持

这是一个有用的审核工具,但它对非英文字符的支持很差,而且非英文字符的存在甚至会影响英语和数字的检测。这里,以简体中文词语“测试”为例,被监控词列表包含三个元素:“测试”、“Test”和“123”。在下面的测试中,这三个示例都没有触发被监控词。

我在网站内搜索,发现了另一个关于“审查词”(Censored words)的类似问题:https://meta.discourse.org/t/censored-words-do-not-respect-word-boundaries-in-non-latin-alphabet/102916。这似乎是整个监控词匹配系统普遍存在的问题?