OneBox在Bookshop.org失败 - 抓取被阻止了吗?

应该要求不允许 OneBox 抓取的网站做什么?

尝试对 Bookshop.org 的图书列表进行 OneBox 会导致:“抱歉,我们无法为此网页生成预览,因为找不到以下 oEmbed / OpenGraph 标签:description、image” — 尽管目标页面存在所需的 OG 标签。

(发布时,此处元页面上的结果与我的网站相同):

https://bookshop.org/p/books/parable-of-the-sower-octavia-e-butler/19767724?ean=9781538732182

OG 详情

页面上确实存在 OG 标签:

我尝试了几个 OpenGraph 验证器:

  • 大多数报告 URL 无法访问。
  • 其中一些从 Bookshop.org 检索到了一些 OG 字段,但没有特定于所请求的页面。
  • iFramely 调试器Facebook 共享调试器 可以进行完整预览。

我了解到 Bookshop.org 正在拒绝某些抓取。如果有什么可以恰当地询问 Bookshop.org 的,例如“请允许 Discourse 用户代理进行抓取?”,我宁愿不引入插件解决方法

1 个赞

Cloudflare 正在阻止 onebox 访问该网站。

请放宽您的机器人保护规则以允许 Discourse Onebox?

3 个赞

确认了,谢谢!我会问他们的。

1 个赞

This topic was automatically closed 30 days after the last reply. New replies are no longer allowed.