Cosa dovrei chiedere a un sito che non consente i crawl di OneBox?
I tentativi di OneBox per gli elenchi di libri di Bookshop.org danno come risultato: “Spiacenti, non siamo riusciti a generare un’anteprima per questa pagina web, perché i seguenti tag oEmbed / OpenGraph non sono stati trovati: description, image” – nonostante i tag OG richiesti siano presenti sulla pagina di destinazione.
(Al momento della pubblicazione, il risultato qui su meta è lo stesso del mio sito):
https://bookshop.org/p/books/parable-of-the-sower-octavia-e-butler/19767724?ean=9781538732182
Ho provato diversi validatori OpenGraph:
- la maggior parte segnala l’URL irraggiungibile.
- un paio di essi recuperano alcuni campi OG da Bookshop.org, ma nulla di specifico per la pagina richiesta.
- il debugger di iFramely e il debugger di condivisione di Facebook gestiscono un’anteprima completa.
Sto raccogliendo informazioni sul fatto che Bookshop.org stia rifiutando alcuni crawl. Preferirei non introdurre una soluzione alternativa tramite plugin se c’è qualcosa di appropriato che potrei chiedere a Bookshop.org di fare, ad esempio, “Si prega di consentire al user agent di Discourse di eseguire il crawl?”.
