Aperçu SEO de Discourse (sitemap / robots.txt )

Discourse dispose de nombreuses fonctionnalités SEO qui fonctionnent dès l’installation. En utilisant nos paramètres par défaut raisonnables, les gestionnaires de communauté peuvent se concentrer sur le développement d’une communauté et ne devraient pas se sentir distraits par l’optimisation pour les moteurs de recherche. Cela dit, il y a certaines choses que vous pouvez modifier, certaines choses que vous devriez savoir et quelques conseils et astuces généraux ci-dessous.

Voici une comparaison de ce qu’un utilisateur voit et de ce qu’un moteur de recherche voit :

Liste des sujets :

Sujet :

Balises Meta

Dans Discourse, les balises méta génériques essentielles au SEO sont générées automatiquement en fonction du contenu présent sur la page. La balise de titre, par exemple, est dérivée du titre du site ou du sujet, et la description est générée à partir du contenu du premier message. Cependant, la personnalisation des métadonnées page par page est limitée. Pour modifier ces valeurs, vous devez ajuster les paramètres ou les champs de contenu à partir desquels elles sont générées.

  • Les paramètres du site Titre, Description et Courte description du site
  • Les noms des catégories
  • Les titres et le contenu des messages
  • Et ainsi de suite :technologist:

Structure des URL et encodage

Caractères non latins et URL

Par défaut, Discourse supprime les caractères non latins des URL de sujets lorsque la langue est définie sur EN. Pour éviter cela, vous pouvez changer la langue pour la langue non latine principale ou changer le paramètre slug generation method (méthode de génération de slug) de ASCII à encoded.

Configuration sous-dossier vs sous-domaine

Discourse privilégie les sous-domaines aux sous-dossiers en raison de sa simplicité technique. Google n’a pas vraiment de préférence entre les deux[^subfolder], mais Discourse recommande fortement d’éviter les configurations en sous-dossiers, sauf si vous avez une compréhension technique approfondie.

[^subfolder] : Vous pouvez en savoir plus à ce sujet sur Secure Uploads.

Canonicalisation

Google tient à indexer les versions canoniques des pages. Dans Discourse, pour un sujet comportant plusieurs réponses, le lien canonique (le premier message) est transmis à Google, qui décide ensuite de l’indexation. Les sujets de plus de 20 messages seront paginés, chaque page étant un lien canonique contenant jusqu’à 20 messages.
Par exemple, la balise canonique de la dernière réponse sur ce sujet sera https://meta.discourse.org/t/try-out-the-new-sidebar-and-notification-menus/238821?page=12.

Balisage Schema

Nous utilisons le balisage schema.org pour aider à catégoriser le contenu dans les moteurs de recherche via les fil d’Ariane. Le nom de la catégorie dans un slug de sujet est inclus :

Sitemap

Discourse intègre un sitemap situé à /sitemap.xml qui est activé par défaut via le paramètre enable sitemap. Cela facilite une meilleure indexation par les moteurs de recherche.

Vue statique pour les moteurs de recherche

Discourse dispose d’une vue HTML statique sans JavaScript pour aider les robots d’exploration à indexer votre site plus rapidement. Le contenu entre la vue dynamique et la vue statique est identique et rien ne sera omis ou supprimé lorsque le site sera exploré par les moteurs de recherche.

Problèmes potentiels avec les robots d’exploration

Les robots d’exploration, également connus sous le nom de robots, sont essentiels pour indexer les pages web. Certains robots, cependant, peuvent être trop enthousiastes et bombarder le forum de nombreuses requêtes. Discourse bloque plusieurs robots d’exploration notoires par défaut, mais vous permet de modifier les paramètres blocked crawler user agents si nécessaire.

robots.txt

Vous pouvez voir et modifier, si nécessaire, robots.txt[^robots]. Ce fichier sert d’outil pour guider les robots d’exploration sur la manière d’interagir avec le contenu du forum. Son objectif principal est de gérer l’accès des robots, de les empêcher de surcharger le serveur et de maintenir la santé SEO du site en évitant l’indexation de pages de faible valeur ou répétitives.

:warning: Modifier ce fichier sans une attention particulière peut nuire à l’indexation de votre site.

[^robots] : Recherchez le paramètre « allow index in robots txt ».

Migrations et redirections d’URL

La fonctionnalité de permalien est utilisée pour rediriger les anciennes URL, dans le but de préserver le SEO, d’éviter les erreurs “Page non trouvée” et d’aider les moteurs de recherche avec les bons métadonnées pour une indexation plus facile.
Si votre site communautaire est migré vers Discourse par notre équipe, les redirections d’URL sont incluses, sauf s’il y a des raisons valables de ne pas le faire.

Si vous utilisez l’un des scripts d’importation existants,, vous devez vous assurer que le script gère cela[^permalink]. Vous pouvez ajouter manuellement des permaliens depuis votre panneau d’administration, dans CustomizePermalinks.

[^permalink] : La recherche de la chaîne permalink dans le script d’importation devrait vous donner cette information.

Discrépance entre les vues de page Discourse et Google Analytics

Discourse et Google Analytics ont des méthodologies différentes en ce qui concerne le comptage des vues de page, ce qui entraîne souvent un nombre de vues de page plus élevé dans Discourse. Cette différence provient du fait que Discourse est une application monopage, comptant ainsi chaque requête significative comme une vue de page.

D’autre part, Google utilise JavaScript pour compter les vues de page uniquement lors du chargement complet de la page, excluant les robots d’exploration par défaut. Contrairement à Google, Discourse compte les requêtes brutes effectuées et génère des vues de page lors du premier chargement d’une page ou lors de la transition entre les routes, rendant leurs mécanismes de suivi distincts les uns des autres.

Si vous souhaitez en savoir plus sur les rapports de données et l’analytique, consultez la catégorie dédiée :

Méthodes de désindexation

Pour retirer des pages de l’index de Google, vous pouvez soit supprimer le contenu, soit bloquer l’accès à une page. Selon vos besoins, vous pouvez rendre votre site entier privé [^login-only]. Vous pouvez exclure des sujets en les supprimant ou en les plaçant dans des catégories restreintes. Les sujets masqués ne sont pas indexés par défaut, mais ils peuvent l’être s’il existe un lien public quelque part qui y redirige.

Pour une suppression durable, l’utilisation de l’outil Suppressions dans la Search Console de Google est la clé pour maintenir les pages hors des résultats de recherche.

En savoir plus sur Remove information on your website from Google - Search Console Help.

[^login-only] : Recherchez le paramètre login required.

19 « J'aime »

Merci pour cet aperçu SEO détaillé pour Discourse ! En tant qu’expert SEO travaillant avec diverses plateformes, je trouve très utile de voir comment Discourse gère les éléments essentiels comme sitemap.xml et robots.txt. La configuration par défaut est assez favorable au SEO, mais je suis curieux de savoir s’il existe des pratiques exemplaires ou des recommandations de plugins pour améliorer davantage le contrôle de l’indexation ou l’intégration du balisage de schéma sur les forums Discourse.

Au plaisir d’en apprendre davantage auprès de la communauté et de contribuer là où je le peux !

2 « J'aime »