我们最近在服务器上部署了 Anubis 来防御资源密集型的 AI 爬虫。它会向带有类浏览器用户代理的请求发送一个静态页面,标题为“正在确认您不是机器人!”然后进行 JavaScript 难度证明,最后重定向到正确的页面。用户代理名称中不包含 Mozilla 的请求可以直接访问页面。
现在,Discourse 的 onebox 链接预览已损坏,但仅限于内联链接。
查看服务器日志,Discourse 发送了两种不同类型的用户代理:
Discourse Forum Onebox v3.4.1 用于大的 onebox 链接预览(请参阅 03f3e84ce520d375aa1c66bb0e95cc5ed9832776 中的 lib/onebox/helpers.rb#L217-L226)
Mozilla/5.0 (Macintosh; Intel Mac OS X 10_15_7) AppleWebKit/605.1.15 (KHTML, like Gecko) Version/14.0 Safari/605.1.15 用于内联链接预览(请参阅 03f3e84ce520d375aa1c66bb0e95cc5ed9832776 中的 lib/final_destination.rb#L40)