应该要求不允许 OneBox 抓取的网站做什么?
尝试对 Bookshop.org 的图书列表进行 OneBox 会导致:“抱歉,我们无法为此网页生成预览,因为找不到以下 oEmbed / OpenGraph 标签:description、image” — 尽管目标页面存在所需的 OG 标签。
(发布时,此处元页面上的结果与我的网站相同):
https://bookshop.org/p/books/parable-of-the-sower-octavia-e-butler/19767724?ean=9781538732182
我尝试了几个 OpenGraph 验证器:
- 大多数报告 URL 无法访问。
- 其中一些从 Bookshop.org 检索到了一些 OG 字段,但没有特定于所请求的页面。
- iFramely 调试器 和 Facebook 共享调试器 可以进行完整预览。
我了解到 Bookshop.org 正在拒绝某些抓取。如果有什么可以恰当地询问 Bookshop.org 的,例如“请允许 Discourse 用户代理进行抓取?”,我宁愿不引入插件解决方法。
