Panoramica SEO di Discourse (sitemap / robots.txt )

Discourse offre molte funzionalità SEO che funzionano subito. Utilizzando le nostre impostazioni predefinite sensate, i community manager possono concentrarsi sulla coltivazione di una community e non dovrebbero sentirsi distratti dall’ottimizzazione per i motori di ricerca. Detto questo, ci sono alcune cose che puoi cambiare, alcune cose che dovresti sapere e alcuni suggerimenti e trucchi generali di seguito.

Ecco un confronto tra ciò che vede un utente e ciò che vede un motore di ricerca:

Elenco argomenti:

Argomento:

Meta Tag

In Discourse, i meta tag generici essenziali per la SEO vengono generati automaticamente in base al contenuto presente sulla pagina. Il tag title, ad esempio, deriva dal titolo del sito o dell’argomento, e la descrizione viene generata dal contenuto del primo post. Tuttavia, la personalizzazione dei metadati per singola pagina è limitata. Per modificare questi valori, è necessario modificare le impostazioni o i campi di contenuto da cui vengono generati.

  • Le impostazioni del sito Titolo, Descrizione e Breve descrizione del sito
  • I nomi delle categorie
  • I titoli e i contenuti dei post
  • E così via :technologist:

Struttura URL e Codifica

Caratteri non latini e URL

Discourse, per impostazione predefinita, rimuove i caratteri non latini dagli URL degli argomenti quando la localizzazione è impostata su EN. Per evitare ciò, puoi cambiare la localizzazione nella lingua non latina principale o cambiare l’impostazione metodo generazione slug da ASCII a codificato.

Configurazione Sottocartella vs. Sottodominio

Discourse tende a preferire i sottodomini rispetto alle sottocartelle per la sua semplicità tecnica. Google non ha una reale preferenza tra i due[1], ma Discourse sconsiglia vivamente di evitare configurazioni con sottocartelle a meno che tu non abbia una profonda conoscenza tecnica.

Canonicalizzazione

Google è interessato all’indicizzazione delle versioni canoniche delle pagine. In Discourse, per un argomento con più risposte, il link canonico (il primo post) viene passato a Google, che poi decide sull’indicizzazione. Gli argomenti più lunghi di 20 post verranno impaginati, ogni pagina sarà un link canonico contenente fino a 20 post.
Ad esempio, il tag canonico per l’ultima risposta in questo argomento sarà https://meta.discourse.org/t/try-out-the-new-sidebar-and-notification-menus/238821?page=12.

Schema Markup

Utilizziamo il markup schema.org per aiutare nella categorizzazione dei contenuti nei motori di ricerca attraverso i breadcrumb. Il nome della categoria nello slug dell’argomento è incluso:

Sitemap

Discourse include una sitemap situata in /sitemap.xml che è abilitata per impostazione predefinita tramite l’impostazione abilita sitemap. Questo facilita una migliore indicizzazione da parte dei motori di ricerca.

Vista statica per i motori di ricerca

Discourse ha una vista HTML statica senza JavaScript per aiutare i crawler web a indicizzare il tuo sito più velocemente. Il contenuto tra la vista dinamica e quella statica è identico e nulla verrà omesso o rimosso quando il sito viene scansionato dai motori di ricerca.

Potenziali problemi per i crawler web

I crawler web, noti anche come robot, sono essenziali per l’indicizzazione delle pagine web. Alcuni crawler, tuttavia, possono essere eccessivamente entusiasti, colpendo il forum con molte richieste. Discourse blocca diversi crawler noti per impostazione predefinita, ma ti consente di modificare le impostazioni user agent dei crawler bloccati se necessario.

robots.txt

Puoi visualizzare e modificare, se necessario, robots.txt[2]. Questo file serve come strumento per guidare i crawler web su come interagire con il contenuto del forum. Il suo scopo principale è gestire l’accesso dei crawler, impedendo loro di sovraccaricare il server e aiutare a mantenere la salute SEO del sito evitando l’indicizzazione di pagine di basso valore o ripetitive.

:warning: Modificare questo file senza un’attenta considerazione può danneggiare l’indicizzazione del tuo sito.

Migrazioni e Reindirizzamenti URL

La funzionalità permalink viene utilizzata per reindirizzare vecchi URL, con l’obiettivo di preservare la SEO, prevenire errori di “Pagina non trovata” e assistere i motori di ricerca con i metadati corretti per un’indicizzazione più semplice.
Se il tuo sito community viene migrato a Discourse dal nostro team, i reindirizzamenti URL sono inclusi a meno che non ci siano valide ragioni per non farlo.
Se stai utilizzando uno degli script di importazione esistenti,, dovresti assicurarti che lo script gestisca questo[3]. Puoi aggiungere manualmente i permalink dal tuo pannello di amministrazione, in PersonalizzaPermalink.

Discrepanza tra visualizzazioni di pagina Discourse e Google Analytics

Discourse e Google Analytics hanno metodologie diverse quando si tratta di contare le visualizzazioni di pagina, portando spesso a un conteggio di visualizzazioni di pagina più elevato in Discourse. Questa differenza deriva dal fatto che Discourse è un’applicazione a pagina singola, che conta ogni richiesta significativa come una visualizzazione di pagina.
D’altra parte, Google utilizza Javascript per contare le visualizzazioni di pagina solo al caricamento completo della pagina, escludendo per impostazione predefinita i crawler web. A differenza di Google, Discourse conta le richieste grezze effettuate ed emette visualizzazioni di pagina al primo caricamento di una pagina o durante la transizione tra route, rendendo i loro meccanismi di tracciamento distinti l’uno dall’altro.

Se desideri saperne di più sui report e sull’analisi dei dati, dai un’occhiata alla categoria dedicata:

Metodi di deindicizzazione

Per rimuovere le pagine dall’indice di Google, puoi rimuovere il contenuto o bloccare l’accesso a una pagina. A seconda delle tue esigenze, puoi rendere privato l’intero sito [4]. Puoi escludere argomenti eliminandoli o inserendoli in categorie ristrette. Gli argomenti nascosti non vengono indicizzati per impostazione predefinita, ma possono esserlo se esiste un link pubblico da qualche parte che reindirizza ad esso.
Per una rimozione duratura, l’utilizzo dello strumento Rimozioni nella Google Search Console è la soluzione per mantenere le pagine fuori dai risultati di ricerca.
Scopri di più su Remove information on your website from Google - Search Console Help.


  1. Puoi leggere di più al riguardo su Secure Uploads. ↩︎

  2. Cerca l’impostazione “consenti indicizzazione in robots txt”. ↩︎

  3. Cercare la stringa permalink nello script di importazione dovrebbe fornirti queste informazioni. ↩︎

  4. Cerca l’impostazione richiesto accesso. ↩︎

19 Mi Piace

Grazie per questa panoramica SEO dettagliata per Discourse! Come esperto SEO che lavora con varie piattaforme, trovo molto utile vedere come Discourse gestisce elementi essenziali come sitemap.xml e robots.txt. La configurazione predefinita è abbastanza SEO-friendly, ma sono curioso di sapere se ci sono best practice o raccomandazioni di plugin per migliorare ulteriormente il controllo dell’indicizzazione o l’integrazione dello schema markup sui forum Discourse.

Non vedo l’ora di saperne di più dalla comunità e di contribuire dove posso!

2 Mi Piace