看起来 Onebox 的内容似乎没有经过“监控词”过滤器的处理。
在我们的论坛上,已有不少人链接了以下漫画。该漫画本身并无不当,但其替代文本(alt text)中包含脏话。Onebox 会抓取并显示该替代文本,但“监控词”功能并未将其标记。看来,“监控词”过滤器也应检查 Onebox 中的任何文本。
看起来 Onebox 的内容似乎没有经过“监控词”过滤器的处理。
在我们的论坛上,已有不少人链接了以下漫画。该漫画本身并无不当,但其替代文本(alt text)中包含脏话。Onebox 会抓取并显示该替代文本,但“监控词”功能并未将其标记。看来,“监控词”过滤器也应检查 Onebox 中的任何文本。
我同意这是一个有趣的边缘情况,但我们要深挖到何种程度呢?图片里甚至可能包含脏话。
我在想,对于这类情况,是否直接依赖用户举报更为合理。
我同意这是一个边缘情况。我的假设是,获取 onebox 文本并运行受监控词汇检查并不困难,而在图像上运行 OCR 则不太实际。
针对这一独特的边缘情况,另一种快速的方法是:通过向您的模板添加少量 JavaScript,直接过滤或移除这些 HTML IMG 元素的 title 属性。
对于有严格边缘情况要求以过滤 IMG HTML 元素 title 属性的网站来说,我认为使用简单的 JS 过滤器更容易实现:
(图片源自原始网站)
希望这对您有帮助 @sciencewhiz