Si tratta di un bug relativo ai contenuti duplicati e dovrebbe essere considerato un problema SEO urgente per la piattaforma Discourse (sto attualmente utilizzando v2.4.0.beta3 +4).
Ho cercato di capire perché ciò stia accadendo e sono rimasto sorpreso nel scoprire che, ispezionando il codice sorgente della pagina, il link canonico viene aggiornato mentre scorro verso il basso:
Quindi, immagino che la logica qui sia che i thread lunghi siano suddivisi in pagine, ma poiché si tratta di un’applicazione a pagina singola (SPA) con caricamento differito, i link canonici si comportano come se fosse in atto una paginazione tradizionale. Onestamente, non sono sicuro di quale sia la motivazione per procedere in questo modo.
A proposito, le migliori pratiche SEO per la paginazione prevedono di NON fornire metadescrizioni e titoli identici per la pagina 2, ecc. Ecco un esempio di come ho implementato la paginazione in un’altra parte del mio sito web:
Qual è la motivazione SEO per fornire link canonici che puntano a punti paginati del thread?
Se questo approccio è in qualche modo giustificato, possiamo almeno assicurarci che titolo e metadati non generino risultati duplicati nelle SERP di Google?
Per i crawler, Discourse utilizza pagine da 20 post, quindi ogni singolo post può essere indicizzato correttamente. Non esiste una SPA per i bot.
Ha oltre 800 post, quindi questo è previsto.
Perché? Qual è il problema reale? Se esegui una ricerca reale per una parola, stiamo collegando a una pagina che non contiene la parola o qualcosa del genere?
Scusa, forse SPA non è il termine corretto; volevo solo dire che un thread di Discourse si comporta in qualche modo come una single page app nel senso che la paginazione avviene dinamicamente…
Sì, immagino abbia senso. Ho provato a cercare un testo nella pagina 3, Google mi ha portato alla pagina 3, quindi sembra tutto ok. Posizione sbagliata all’interno della pagina, ma probabilmente è il più vicino che possiamo arrivare in questa situazione.
Quindi, ripensandoci, immagino che avere i canonical per la paginazione abbia senso nei thread più lunghi, ma se guardi le best practice per la SEO, la raccomandazione è di non permettere a Google di indicizzare contenuti paginati con titolo e meta description identici. Immagino che la soluzione qui sia cambiare il titolo e i meta nelle pagine successive. Vedi:
Come potrebbe essere meglio per i visitatori umani del forum? Non pensi che alcuni potrebbero confondersi se pensano di andare, ad esempio, alla “pagina 2” e si ritrovano invece nella sezione “l’unica pagina”? Potrebbero cercare invano una navigazione di paginazione che non esiste?
Preferisco avere più visitatori confusi che meno traffico da Google. Il contenuto duplicato è un vero problema SEO, e i “mi piace” sul tuo commento da parte di due membri del team di Discourse sono davvero sconcertanti.
Non sono sicuro che sia abbastanza grave da definirlo “un vero problema SEO”. Per quanto ne so, senza rel="canonical", sono i motori di ricerca a decidere quale URL del risultato corrisponde meglio alla ricerca, invece di scegliere l’URL che il sito preferirebbe come risultato canonico.
Credo che tu possa aver saltato l’immagine che ho pubblicato sopra… Ecco il testo:
John Mueller ha commentato, “Non trattiamo la paginazione in modo diverso. Li trattiamo come pagine normali.”
Ciò significa che le pagine paginate non sono riconosciute da Google come una serie di pagine consolidate in un unico contenuto, come consigliato in precedenza. Ogni pagina paginata è idonea a competere con la pagina radice per il posizionamento.
Per incoraggiare Google a restituire la pagina radice nei risultati dei motori di ricerca (SERP) e prevenire gli avvisi di “Meta descrizioni duplicate” o “Tag titolo duplicati” in Google Search Console, apporta una semplice modifica al tuo codice.
Se la pagina radice ha la formula:
Le successive pagine paginate potrebbero avere la formula:
Questi titoli di pagina e meta descrizioni delle URL paginate sono intenzionalmente subottimali per dissuadere Google dal mostrare questi risultati invece della pagina radice.
Se anche con tali modifiche le pagine paginate continuano a posizionarsi nei risultati dei motori di ricerca, prova altre tradizionali tattiche di SEO on-page come:
Sminuire i tag H1 delle pagine paginate.
Aggiungere testo utile sulla pagina radice, ma non sulle pagine paginate.
Aggiungere un’immagine di categoria con un nome file ottimizzato e un tag alt alla pagina radice, ma non alle pagine paginate.
Ah, grazie, ho notato che il problema non riguarda il contenuto duplicato, ma gli avvisi relativi a titoli e meta descrizioni duplicati.
Per Discourse, almeno, questi sono più simili a “avvisi” che a veri e propri errori. È un po’ come dire: “se non ne eri a conoscenza, controlla che sia tutto a posto e, se non lo è, correggi”. Puoi ignorarli tranquillamente, poiché una discussione in un topic non dovrebbe divagare al punto da rendere inappropriato per i post successivi ciò che era valido per i primi.
Ad esempio, se i post della “pagina 1” parlano di “viti rosse rotonde” e nella “pagina 2” si parla di “ingranaggi verdi quadrati”, i membri dovrebbero essere invitati a rimanere in tema o la discussione dovrebbe essere suddivisa in topic separati.