Perché Google non indicizza Discourse? Preoccupazioni SEO

Non sono sicuro del motivo per cui Google non sta indicizzando il contenuto della nostra community di discourse.

Guarda questa pagina qui: Welcome to the Appsmith Community | Appsmith Community Portal
Il titolo è piuttosto unico. Immaginerei che, quando copio e incollo il titolo in Google, il primo link dovrebbe essere l’URL sopra.
Invece ottengo questo: Non solo non è il primo link, ma non compare affatto.

Cosa sto sbagliando?

2 Mi Piace

Ci potrebbero essere tantissimi motivi per questo.

Il Googlebot sta effettivamente scansionando il tuo sito? Controlla mysite.com/admin/reports/web_crawlers

Il Googlebot è bloccato o limitato nella frequenza? Controlla mysite.com/admin/site_settings/category/security?filter=crawler%20user%20agents

Hai aggiunto il tuo sito a Google Search Console?

Le persone che utilizzano l’hosting autonomo possono persino installare il seguente plug-in per aiutarti

2 Mi Piace

Il plugin Sitemap è disponibile anche nei nostri piani Business e Enterprise.

Probabilmente niente. Per qualche motivo, Google sembra dare alla domanda “Come faccio a fare X” una priorità maggiore rispetto all’argomento effettivo con quel titolo esatto. Perché? Non sono sicuro. Potrebbe essere semplicemente un’IA che prende quella decisione in base a schemi sconosciuti.

6 Mi Piace

Anche Google Patterns che nessuno conosce :wink:

2 Mi Piace

Allora questo è un grosso problema per noi. Ci occuperemo di questo, ma vanifica l’intero scopo, perché non possiamo aspettarci che le persone “esaminino” ogni argomento della community. In pratica, la maggior parte delle persone cercherà su Google il proprio problema (anche se sono membri della community) per arrivare alla soluzione.

2 Mi Piace

È davvero difficile capire cosa sta succedendo con Google nel tuo caso. Mi sono preso la libertà di dare un’occhiata più da vicino alle statistiche del tuo crawler e a prima vista sembra che il crawler di Google non visiti molto spesso la tua community. Hai già provato a ottenere informazioni dalla Google Search Console? Forse ci sono informazioni che potrebbero aiutare a risolvere questo problema.

Sto riscontrando lo stesso comportamento per una piccola parte degli argomenti creati di recente qui su Meta. Ne discuterò con il nostro team per scoprire se c’è qualcosa che possiamo fare o se è semplicemente Google che fa Google. Ti terrò aggiornato.

Inoltre, hai visto i nostri due post sul blog su SEO?

2 Mi Piace

Questo comportamento di Google è iniziato mesi fa e purtroppo sta peggiorando.

La sitemap nel mio caso non ha aiutato…

1 Mi Piace

Sì, questa è la prima domanda che farei.

4 Mi Piace

Beh… il nostro sito è appsmith.com, quindi tutti i sottodomini e le sottocartelle di appsmith.com dovrebbero idealmente essere indicizzati quando inviamo appsmith.com a GSC, giusto?

Ho comunque aggiunto community.appsmith.com (il nostro forum Discourse) a GSC oggi, ma non sono sicuro che ciò cambierà qualcosa.

Aggiungerei il sottodominio come proprietà autonoma nella tua GSC e invierei una sitemap dedicata per il sottodominio.

1 Mi Piace

@constantine

Il tuo forum è indicizzato da maggio 2021

:slight_smile:

Sembra quindi un problema. Perché non possiamo assolutamente continuare se Google non indicizza i singoli post, dato che ciò vanifica l’intero scopo di avere la community (poiché la maggior parte delle persone scoprirà i contenuti da Google, compresi i nostri attuali utenti, invece di passare attraverso le categorie su Discourse).

E questo non sembra essere un problema solo sul nostro Discourse, ma anche su questo forum (meta.discourse.org).

Per dimostrarlo, ho cercato su Google il titolo di questo post e questo è il risultato che ho ottenuto:

In sostanza, per le persone che finiscono per utilizzare la community Discourse come knowledge base (cosa che ovviamente molte aziende fanno), questo diventa un grosso problema.

Abbiamo seguito praticamente la maggior parte delle linee guida fornite nei 2 blog sull’SEO condivisi sopra, i nostri contenuti sono ricchi, dettagliati, altamente tecnici. Eppure, quando le persone li cercano su Google, non compaiono.

Quindi, domande sincere: dato il nostro caso d’uso (creare una knowledge base tramite richieste di supporto, che può anche aiutare con l’SEO), e visto il problema in questione, consigliereste di iniziare a pianificare la ricerca di un’alternativa?

1 Mi Piace

Ecco un estratto da Google

L’indicizzazione dei tuoi contenuti da parte di Google è determinata da algoritmi di sistema che tengono conto della domanda degli utenti e dei controlli di qualità.

Ricorda anche che solo gli utenti TL3 e superiori hanno i link nofollow disabilitati.

Ecco qualcosa da leggere:

In altre parole, i miei post hanno più “peso” dei tuoi post.

mi scuso, hai ragione :+1:

1 Mi Piace

@constantine Sembra che Google preferisca le pagine sul sottodominio https://docs.appsmith.com rispetto alle pagine su https://community.appsmith.com

La maggior parte dei risultati di ricerca proviene da docs.appsmith.com
Google Search

Un’ipotesi: la preferenza di Google per un sottodominio rispetto all’altro potrebbe essere influenzata dai “Core Web Vitals” Largest Contentful Paint (LCP)
Il report simulato su https://pagespeed.web.dev/ è “buggato” da Discourse. Meglio controllare il report di Google Search Console “Esperienza” → “Core Web Vitals” per il tuo dominio.

Solo un aggiornamento, gente, abbiamo ospitato discourse in self-hosting e abbiamo inviato la sitemap alla search console e ora i nostri contenuti vengono indicizzati da Google. Quindi forse c’è qualcosa che non va con la versione ospitata su cloud?

Non sono sicuro che questo sia correlato alle sitemap o all’hosting cloud. Meta è ospitato su AWS, che è un posto completamente diverso da dove ospitiamo molti dei nostri altri clienti e abbiamo iniziato a vedere risultati molto disomogenei per meta ultimamente e per parecchi siti su varie opzioni di hosting.

Ho cercato di ottimizzare alcune cose per vedere se qualcosa aiuta.

  • Non seguiamo più i link a .rss, il che evita a Google di scansionare le varianti /1 /2 ecc. di un argomento che condividono tutte una canonica.

  • Diciamo esplicitamente a Google di non seguire i link all’interno del feed .rss nel caso in cui ottenga un feed rss.

  • Ho temporaneamente disabilitato alcune ottimizzazioni canoniche che avevamo fatto - che sembravano promettenti: Search engines now blocked from indexing non-canonical pages

Il sintomo che sto osservando qui su meta è che

  1. Google sta effettivamente scansionando TUTTO il contenuto, posso vederlo nei weblog
  2. Nonostante la scansione delle pagine, circa il 50% dei nuovi argomenti recenti di meta non compare nell’indice.

Questo è estremamente preoccupante, Google ci dà pochissima visibilità sul “perché?”.

Il mio prossimo passo è ottenere maggiori dati e creare un report in corso, probabilmente useremo serpapi per capire quali pagine mancano da Google e cercare di individuare uno schema.

5 Mi Piace

Perché Meta, intendendo qui gli OP, non usa il “perché?” come vuole Google? Ho fatto alcune esperienze e anche se il contesto rimane lo stesso, usare frasi diverse cambia i risultati della ricerca. Come previsto.

E… la cronologia delle ricerche personali è una cosa grande e non così buona. I miei risultati puntano abbastanza spesso altrove rispetto a Meta, perché faccio ricerche qui, non tramite Google.

Sì. Discourse potrebbe ancora avere alcuni problemi con Google, e questo potrebbe o non potrebbe derivare dallo “stato del forum” in cui Google non reagisce ai forum allo stesso modo di un sito web ordinario. O ci sono alcuni problemi tecnici, anche se questa è la ragione abbastanza raramente.

È la stessa cosa che ho fatto, dopo un periodo iniziale di miglioramento poi ritorna ad essere ignorato.
Dopo due mesi ormai anche i nuovi thread nella sitemap non vengono indicizzati, è una situazione che va avanti da mesi e abbiamo perso moltissime visualizzazioni.

Vogliamo provare questo per un mese e se non migliora cambieremo software :sob:

Controlla il report della Search Console di Google “Indice” → “Copertura” per le pagine “mancanti”. Questo potrebbe non mostrarti il “perché”, ma “cosa sta succedendo”.

  1. Apri “Indice” → “Copertura” per il tuo dominio.

  2. Seleziona “Tutte le pagine inviate”

  3. Guarda in particolare “Escluse”

Descrizione delle diverse fasi: Page indexing report - Search Console Help

La mia ipotesi su Google: “Scansionata - attualmente non indicizzata” ha un limite massimo impostato da Google - mentre ci sono troppe pagine in questo stato, le nuove pagine entreranno nell’indice di Google molto lentamente.


Sulle prestazioni del crawler di Google, vedi il report della Search Console di Google “Impostazioni” → “Statistiche di scansione”

Qui è particolarmente interessante la cronologia e lo sviluppo del “tempo di risposta medio”: risposta più veloce = più richieste di scansione

Ed è interessante anche “Per scopo”: