Invia intestazione canonical link invece di intestazione noindex

Invia un’intestazione di link canonical invece di un’intestazione noindex.

L’invio di un’intestazione canonical ha probabilmente lo stesso vantaggio sul budget di scansione dell’invio di un’intestazione noindex, senza le implicazioni SEO dell’esclusione di URL che potrebbero avere backlink tramite noindex.


Vedi anche How to Specify a Canonical with rel="canonical" and Other Methods | Google Search Central  |  Documentation  |  Google for Developers

Se puoi configurare il tuo server, puoi utilizzare un’intestazione HTTP rel="canonical" (invece di un tag HTML) per indicare l’URL canonico per un documento supportato dalla Ricerca, inclusi documenti non HTML come i file PDF.

  • :+1: Possiamo configurare il nostro server.
  • utilizzare un'intestazione HTTP rel="canonical" invece di un tag HTML enfatizza una preferenza per la soluzione dell’intestazione HTTP?

Da #11553

Googlebot gestisce le intestazioni no-index in modo molto elegante. Consiglia di lasciare aperte quante più route possibile e utilizza le intestazioni per regole ad alta fedeltà riguardanti gli indici.

Forse Google gestisce le intestazioni di link canonical con la stessa eleganza delle intestazioni no-index.

1 Mi Piace

Sto lottando con questo, leggendo la raccomandazione di Google sembra che non gli importi particolarmente.

Le raccomandazioni per l’intestazione HTTP rel="canonical" sono le stesse del tag link rel="canonical".

Suppongo che non ci sia molto da perdere ed è possibile che un mix di no index più rel canonical sia la giusta ricetta di Google. Ma non ne sono sicuro.

@Falco ?

Questa operazione sta annullando l’impostazione del sito introdotta di recente in quella che è essenzialmente una noop (spostando ciò che inviamo come tag di intestazione in un’intestazione, nessuna modifica semantica).

Non voglio questa modifica così com’è.

1 Mi Piace

[quote=“sam, post:2, topic:220213”]
Suppongo che non ci sia molto da perdere ed è possibile che un mix di no index più rel canonical sia la giusta ricetta di Google. Ma non ne sono sicuro.
[/quote]Per il nuovo valore predefinito SiteSetting.allow_indexing_non_canonical_urls = false, questo è il modo in cui è implementato al momento e rimane così:

  • header noindex
  • html link-tag canonical (potrebbe essere ignorato)

Senza patch e SiteSetting.allow_indexing_non_canonical_urls = true

  • – nessun header –
  • html link-tag canonical

Con patch e SiteSetting.allow_indexing_non_canonical_urls = true

  • header: Link: <https://forum.example.com/t/test-example/1234>; rel="canonical"
  • html link-tag canonical (potrebbe essere ignorato - ma comunque uguale all’header)

L’intera idea dietro questo:
Imposta canonical come http-header per ottenere lo stesso beneficio dell’ http-header noindex - ovvero un crawling più veloce.
Ciò potrebbe rendere noindex obsoleto con le sue implicazioni incerte.

Un altro punto su noindex vs canonical:

  • noindex è più di un segnale molto forte a non inserire la pagina nell’indice di ricerca.
    Ma con noindex il contenuto della pagina viene comunque elaborato da Google Bot per estrarre i link (c’è l’opzione aggiuntiva nofollow per disabilitare questo).
  • canonical è un segnale forte che il contenuto da indicizzare si trova su un altro URL canonico.
    Nel caso in cui Google Bot decida di accettare questo segnale per una pagina, c’è una grande possibilità che non elabori affatto il contenuto della pagina – ed elabori solo l’URL canonico.

Questo è un ‘esperimento mentale’. Non è implementato da nessuna parte – e non consiglio mai di implementarlo:

  • header noindex
  • html meta-tag noindex (invece di: html link-tag canonical)

– OPPURE –

  • – nessun header –
  • html meta-tag noindex

Perché implementarlo o non implementarlo in questo modo?

Questa modifica non è una ‘noop’:
Google potrebbe gestire gli header e i contenuti HTML in diverse fasi delle sue code di elaborazione. Inviando gli header potremmo saltare ulteriori code di elaborazione (ad es. la coda di rendering) e quindi liberare budget di scansione per pagine più importanti.

Vedi In-Depth Guide to How Google Search Works | Google Search Central  |  Documentation  |  Google for Developers

(L’unico grafico della coda di elaborazione che ho trovato: Understand JavaScript SEO Basics | Google Search Central  |  Documentation  |  Google for Developers)

La modifica noindex è stata recentemente annullata:

Puoi dare una nuova occhiata a questa PR:

Non sono fortemente contrario, ma sembra così insignificante. Google scarica sempre contenuti di questi tempi, dubito che il salvataggio di un’analisi HTML farà davvero una differenza materiale.

Ci sono molte altre aree che necessitano di attenzione prima, i microdati sono probabilmente il primo posto che ha bisogno di cure.