Que devrais-je demander à un site qui n’autorise pas les crawls OneBox ?
Les tentatives de OneBox pour les listes de livres de Bookshop.org aboutissent à : “Désolé, nous n’avons pas pu générer un aperçu pour cette page web, car les balises oEmbed / OpenGraph suivantes n’ont pas pu être trouvées : description, image” – malgré la présence des balises OG requises sur la page de destination.
(Au moment de la publication, le résultat ici sur meta est le même que sur mon site) :
https://bookshop.org/p/books/parable-of-the-sower-octavia-e-butler/19767724?ean=9781538732182
J’ai essayé plusieurs validateurs OpenGraph :
- la plupart signalent l’URL comme inaccessible.
- quelques-uns récupèrent quelques champs OG de Bookshop.org, mais rien de spécifique à la page demandée.
- le débogueur iFramely et le débogueur de partage Facebook parviennent à un aperçu complet.
Je suppose que Bookshop.org rejette certains crawls. Je préférerais ne pas introduire une solution de contournement via un plugin s’il y a quelque chose d’approprié que je pourrais demander à Bookshop.org, par exemple : “Veuillez autoriser l’agent utilisateur Discourse à crawler ?”
