I motori di ricerca ora bloccati dall'indicizzazione di pagine non canoniche

Maggiori informazioni su noindex dalla documentazione di Google:


Vedi Crawl Budget Management For Large Sites | Google Search Central  |  Documentation  |  Google for Developers


Vedi How to Specify a Canonical with rel="canonical" and Other Methods | Google Search Central  |  Documentation  |  Google for Developers

Vedi How to Specify a Canonical with rel="canonical" and Other Methods | Google Search Central  |  Documentation  |  Google for Developers

3 Mi Piace

Questo comando non sembra funzionare. Oggi ho aggiornato un sito Discourse più piccolo per testarlo, ho eseguito il comando e vedo ancora gli header noindex.


Modifica: Non sono sicuro di come funzioni quella impostazione, ma non la vedo in SiteSettings, almeno dal frontend (come amministratore) nella console del browser:

var d = Discourse.SiteSettings;
document.body.innerHTML = `\u003cpre\u003e${JSON.stringify(d, null, 4)}\u003c/pre\u003e`;

Sembra che quell’impostazione sia per robots.txt, non per noindex. Non dovrebbe essere già true sulla maggior parte dei siti Discourse?

2 Mi Piace

Oh scusa, il corretto è SiteSetting.allow_indexing_non_canonical_urls. L’ho corretto nell’OP.

3 Mi Piace

Abbiamo continuato ad analizzare i problemi successivi a questa modifica e abbiamo deciso di annullarla come da:

L’obiettivo era limitare il budget di scansione da parte di Google speso per la scansione di link di argomenti non canonici.

Poiché questa modifica è stata applicata, abbiamo implementato 2 correzioni che hanno reso la modifica non necessaria.

  1. I feed RSS degli argomenti non vengono più seguiti, i link nei feed RSS non vengono seguiti. Ad esempio: https://meta.discourse.org/t/search-engines-now-blocked-from-indexing-non-canonical-pages/218985.rss

  2. I feed RSS dei post ora contengono link canonici. Ad esempio: https://meta.discourse.org/posts.rss

Insieme, queste due modifiche significano che i crawler non scoprono più una grande quantità di link non canonici sui siti Discourse.

Ciò libera il budget di ricerca e rende l’impostazione del sito non più un requisito. Gli operatori del sito sono ancora liberi di sperimentare con essa, tuttavia è disabilitata per impostazione predefinita.

13 Mi Piace