Besoin d'une méthode pour ajouter "meta robots noindex" dans les sujets d'une catégorie

Suite à la discussion sur SEO pour le contenu mince ou modification des balises méta :

Je rencontre le même problème ici.

J’utilise WP-Discourse et c’est excellent ! Mais pour chaque nouvel article de blog, il crée un sujet avec exactement le même titre dans ma communauté. Deux URLs avec le même titre n’est pas une bonne chose, car cela vole de la pertinence l’un à l’autre dans les résultats de recherche.

Ensuite, les commentaires du sujet sont également affichés sous les articles de blog, ce qui génère du contenu dupliqué (le même contenu sur plusieurs URLs).

Ce sont deux énormes problèmes de SEO, qui pourraient entraîner une pénalité de domaine.

Comment résoudre ce problème ?

La solution serait une simple case à cocher dans la boîte de configuration de la catégorie :

[ ] Masquer les sujets de cette catégorie dans les résultats de recherche.

Lorsque la case est cochée, une balise noindex serait insérée dans l’en-tête de toutes les pages qui y sont liées : la catégorie elle-même, les sujets, la pagination, etc.

<meta name=“robots” content=“noindex, dofollow”>

De cette façon, tout reste accessible aux utilisateurs, mais ignoré par les moteurs de recherche.


Ce qui ne résout pas le problème

Permettez-moi d’anticiper et de répondre à certaines réponses courantes. J’ai vu plusieurs sujets sur ce problème, et ils proposaient tous des solutions qui ne résolvent pas réellement le problème.

Robots.txt

La solution la plus couramment proposée consiste à ajouter une ligne “disallow: /c/category/id” dans le fichier robots.txt. Mais cela ne supprimerait que la catégorie elle-même des résultats de recherche, et non les sujets, qui sont le principal problème ici.

La structure des URLs des sujets est toujours la même, nous ne pouvons donc pas les bloquer en ajoutant simplement une ligne “disavow” dans robots.txt.

Exemple :

Login | HSTS Redirection Community

Sujets non répertoriés

Un sujet non répertorié reste visible pour les moteurs de recherche. Il sera masqué dans les listes de la communauté, mais vous pouvez toujours accéder au sujet si vous avez le lien direct. Et nous devons envoyer les utilisateurs vers les sujets, nous ajoutons donc un lien vers eux dans l’article de blog. Ainsi, les moteurs de recherche trouveront également tous les sujets non répertoriés.

Notez que le fait de mettre une balise nofollow sur ce lien n’empêchera pas Googlebot de l’ignorer : Official Google Webmaster Central Blog: Evolving “nofollow” – new ways to identify the nature of links

En même temps, le fait de ne pas répertorier le sujet entraîne une réduction de l’engagement des utilisateurs, car les utilisateurs ne pourront pas passer d’un sujet à l’autre au sein de la communauté.

Cette idée ne résout donc rien. Elle entraîne une réduction de l’engagement, sans masquer les sujets aux moteurs de recherche.

Exiger une connexion pour voir les sujets de cette catégorie

Lorsqu’un nouvel utilisateur clique sur le bouton de commentaire, il/elle verra un message « Cette page n’existe pas » au lieu du sujet. L’utilisateur pense que quelque chose est cassé et quitte ensuite le site. Donc, pas de commentaires et pas de nouvelle inscription d’utilisateur. Très mauvais pour l’engagement et l’utilisabilité.


En conclusion, il serait très utile d’ajouter cette option à Discourse, ou si quelqu’un pouvait développer un simple plugin.

Cela doit être intégré au cœur du système, sinon Googlebot ignorera le JavaScript.

Les experts en SEO apprécieront grandement !

4 « J'aime »

This doesn’t directly answer your question, but Discourse has a new embed set canonical url site setting that might help you. When that setting is enabled, the canonical URL of Discourse topics that have been created through the WP Discourse plugin or through the Discourse javascript embed code will be set to the URL of the associated blog post.

4 « J'aime »

That does help, thank you!

I didn’t knew about this new feature.

One question, though:

I’m not very familiar about how embed works, besides wp-discourse. If a user creates a topic pointing to other internal links, will it be set as canonical?

1 « J'aime »

No, if a user creates a topic by pasting a URL into the composer’s title field, a featured link will be created. This does not cause the featured link URL to be set as the canonical URL.

When the embed set canonical url site setting is enabled, topics that have an associated topic_embed will have their canonical URL set to the topic_embed’s URL. The Discourse javascript embed code does this automatically. It can also be done by creating a topic through the API and passing an embed_url property. This is how our WordPress plugin works.

3 « J'aime »

Salut @simon et l’équipe - beau fil de discussion ! Je rencontre le même problème pour ma communauté (https://community.americanradioclub.com/). J’aimerais publier automatiquement sur Discourse, mais pour certains (sinon tous) les articles de WordPress, je veux définir un no-index sur la discussion Discourse afin d’éviter le contenu dupliqué et d’être pénalisé en SEO. Quelqu’un a-t-il trouvé une bonne solution à cela ? Merci !

3 « J'aime »

@James_Cribbs Avez-vous pu résoudre ce problème ?

Il n’y a rien à résoudre. Il n’y a absolument aucune question de référencement. Discourse indique que l’original se trouve dans l’adresse wordpress.

Si quelqu’un veut manipuler SER pour donner deux résultats identiques, tout le contenu doit être différent.

Ce sujet devrait être clos.