Ciao @kirupa,
FYI, quando Google indicizza due siti nello stesso dominio, ad esempio nel tuo esempio kirupa.com con contenuti simili, di solito la cosiddetta “penalità” (in realtà non è proprio una “penalità”, ma piuttosto una “selezione canonica”) comporta che l’algoritmo di Google scelga una delle pagine come canonica e questa pagina avrà un posizionamento più alto nei risultati di ricerca. (Google potrebbe anche rimuovere dall’indice la pagina che ritiene non canonica).
Google è stato molto chiaro al riguardo: l’idea di una “penalità per contenuti duplicati” è in gran parte un mito. Si tratta davvero di “canonizzazione” e “selezione”:
Se il tuo sito contiene più pagine con contenuti sostanzialmente identici, ci sono diversi modi per indicare a Google l’URL preferenziale. (Questo è chiamato “canonizzazione”). Ulteriori informazioni sulla canonizzazione. (Ref 1)
Ad esempio, se mantieni attivo il tuo vecchio sito insieme al nuovo, puoi utilizzare il tag link canonical per indicare a Google che il tuo nuovo sito è il sito canonico, e Google darà priorità al tuo nuovo sito.
Una soluzione migliore è permettere ai motori di ricerca di scansionare questi URL, ma contrassegnarli come duplicati utilizzando l’elemento di collegamento rel="canonical", lo strumento di gestione dei parametri URL o reindirizzamenti 301. Nei casi in cui i contenuti duplicati portino a una scansione eccessiva del tuo sito web, puoi anche regolare l’impostazione della velocità di scansione in Search Console. (Ref 1)
Esempio:
<link rel="canonical" href="https://forum.kirupa.com/t/js-tip-of-the-day-using-generators-to-animate/643058" />
@kirupa, hai anche chiesto:
Ogni argomento è considerato una “pagina” indicizzabile da Google? La ragione per cui lo chiedo è che una gran parte degli argomenti del nostro forum non è presente nel database di Google.
Per un’ottima (anche se un po’ datata) discussione su Google e lo scroll infinito, ti consiglio il Blog Ufficiale di Google Webmaster Central, (Ref 2):
https://webmasters.googleblog.com/2014/02/infinite-scroll-search-friendly.html
@kirupa, un modo per verificare (in pratica, non in teoria) è utilizzare GSC e guardare la loro “schermata” di come rappresentano la tua pagina. Questo si fa facilmente con la funzione “verifica compatibilità mobile” in GSC (ad esempio); e se prendi un post molto lungo in Discourse, puoi verificare quanto di quella pagina viene indicizzato da Google (letto e indicizzato). Ci sono molte opinioni sullo scroll infinito e su come Google indicizzi queste pagine. Puoi usare GSC per controllare le tue pagine e vedere con i tuoi occhi.
Secondo Martin Splitt di Google (vedi Riferimento 3), il 14 aprile 2020:
Splitt ha fornito l’esempio di un sito di notizie che si affida allo scroll infinito (chiamato anche “lazy loading”) per caricare nuovi contenuti.
Ciò significa che la pagina web, in questo caso la home page, non carica contenuti aggiuntivi fino a quando un visitatore non scorre fino in fondo allo schermo.
Splitt spiega perché questo è un problema: “Cosa non fa Googlebot? Non scorre.”
Ciò che fa Googlebot è atterrare su una pagina e scansionare ciò che è immediatamente visibile.
Secondo quanto dichiarato da Splitt, Googlebot non può scansionare contenuti che vengono caricati solo dopo lo scorrimento della pagina.
Come accennato, @kirupa, puoi controllare le tue pagine utilizzando gli strumenti di GSC, che ti mostreranno un’istantanea di come Google visualizza (e indicizza) le tue pagine.
Secondo Splitt di Google nell’aprile 2020: “Googlebot non scorre.” (parafrasando)
Per quanto riguarda la domanda sull’indicizzazione delle ricerche Google e Discourse, ogni proprietario di sito può facilmente utilizzare GSC per determinare come Googlebot indicizza una pagina specifica.
Il mio consiglio, e spero che questo possa essere d’aiuto in qualche piccola misura, è di utilizzare GSC (Google Search Console) per controllare le tue pagine se hai dubbi su come Googlebot le indicizza.
Riferimenti:
-
How to Specify a Canonical with rel="canonical" and Other Methods | Google Search Central | Documentation | Google for Developers
-
https://webmasters.googleblog.com/2014/02/infinite-scroll-search-friendly.html
-
Google’s Martin Splitt Explains Why Infinite Scroll Causes SEO Problems