Je ne dis pas de supprimer les informations temporelles, mais simplement qu’il serait préférable de n’envoyer que l’horodatage lisible par machine pour la publication principale. Du point de vue du classement d’une page dans les résultats de recherche, un sujet de forum est essentiellement un article (publication principale) avec une série de commentaires. Il n’importe pas à un moteur de recherche quand les commentaires ont été faits.
Mise à jour : une autre façon de transmettre la date à Google pour un commentaire (par opposition à la page entière) est le balisage schema.org.
Bien sûr, /8 pointe vers la 8ème publication, mais du point de vue d’un bot et de Google, il s’agit exactement du même contenu et de la même URL. Si vous voulez que Google sache que /8 doit être traité exactement de la même manière que le sujet dans les résultats de recherche, alors le site ne devrait pas envoyer de signal intentionnel indiquant qu’ils sont différents. Seul l’utilisateur humain a besoin de savoir que les horodatages sont différents, et cette information est imprimée dans le texte de la page.
Si quelqu’un chez Google doit prendre des décisions sur le moment de remplacer les URL canoniques définies par le site, l’une de ces exceptions pourrait être quelque chose comme “deux horodatages différents dans les métadonnées intentionnelles signifient des pages différentes – par conséquent, remplacer l’URL canonique.”
Il est souvent difficile pour les programmeurs de penser à tous les cas limites, sauf s’ils ont l’expérience de rencontrer cette chose, il peut donc être inconcevable pour les programmeurs de Google que des pages identiques puissent avoir deux horodatages différents, même s’il est facile pour les utilisateurs de Discourse de comprendre pourquoi cela pourrait se produire.
J’ai travaillé dans une entreprise où une partie de mon travail consistait à faire désindexer des sites de Google. (Ils ne faisaient rien de louche, mais il y avait des problèmes techniques.) Comme personne ne savait exactement comment fonctionne la technologie de classement de Google, et qu’elle change régulièrement, le point de départ était d’essayer de penser comme un ingénieur de recherche et de supprimer tout ce qui pourrait être ambigu ou déroutant pour les machines. Je ne pouvais jamais dire exactement quelle chose fonctionnait, mais cela fonctionnait toujours après un certain temps à corriger systématiquement des choses comme ça.
C’est inclus. Si vous souhaitez activer cette fonctionnalité expérimentale, vous devez modifier la valeur du paramètre de site caché SiteSetting.allow_indexing_non_canonical_urls.
Actuellement, Google utilise correctement les URL canoniques :
Nous pouvons superviser cela via la Google Search Console avec le rapport « Index » → « Couverture » → « Page alternative avec une balise canonique appropriée »
À propos de Page alternative avec une balise canonique appropriée :
« Cette page est un doublon d’une page que Google reconnaît comme canonique. Cette page pointe correctement vers la page canonique, il n’y a donc rien à faire pour vous. »
Je n’ai aucune idée de la façon dont les liens /X pour chaque réponse affectent le référencement, et j’essaie généralement d’éviter de céder aux caprices de Google. Mais d’un point de vue pratique, je constate que Google ne détecte pas les nouvelles réponses dans de nombreux sujets de longue date sur mon forum Discourse, alors qu’il indexe rapidement la plupart des nouveaux sujets. Et lorsqu’il indexe une nouvelle réponse, le lien ne mène pas à la réponse spécifique mais plutôt à /XXXX?page=YY. Je n’ai aucune idée si c’est bon pour le référencement, mais ce n’est certainement pas bon pour les utilisateurs humains qui recherchent quelque chose de spécifique.
Ce sujet est resté silencieux pendant un bon moment. Je me demandais : quelqu’un a-t-il testé cette fonctionnalité expérimentale ? Maintenant que plus de deux ans se sont écoulés, j’aimerais savoir si elle est toujours considérée comme expérimentale ou si quelqu’un peut confirmer qu’elle résout le problème ?
À ma grande joie, Google ne m’a PAS montré une longue liste de réponses individuelles dans les résultats ! Les seuls résultats étaient le sujet lui-même et la catégorie dans laquelle il se trouve ! C’est un EXCELLENT signe !
Cependant, lorsque je fais la même recherche que @RGJ a faite en novembre 21, le problème persiste avec cette recherche spécifique.
J’ai également effectué une nouvelle recherche de test avec un autre sujet sur ce forum communautaire Discourse, et j’ai trouvé un problème similaire, avec plusieurs résultats provenant du même sujet.
C’est formidable de voir que ce problème n’existe pas toujours avec tous les forums Discourse… mais je ne comprends pas pourquoi le problème serait résolu avec le forum Python alors qu’il existe toujours dans le forum Discourse.
Quelqu’un a-t-il des idées sur la façon de résoudre ce problème ?
J’envisage de migrer un forum existant de NodeBB vers Discourse, mais avant de le faire, je dois savoir s’il existe un moyen de résoudre ce problème afin qu’il ne crée pas un cauchemar SEO pour notre domaine.
Cette recherche renvoie un petit nombre de liens vers le sujet, mais le sujet contient 58 messages, vous vous attendriez donc à voir 58 résultats individuels si les URL /nn étaient toutes indexées. Il est possible que le robot d’indexation voie des liens vers des messages dans le sujet dans d’autres messages, il indexe donc ces pages individuelles ?
Cela dit, désactiver /nn serait un cauchemar pour mon forum. Il y a souvent de longues discussions sur la façon de résoudre les problèmes qui peuvent contenir plusieurs solutions, celle-ci semble fonctionner, suivie quelques messages plus tard par un message « oh non, ça ne fonctionne pas ». Nous nous référons souvent aux messages de « correction » réels lorsque quelqu’un d’autre a ce problème à l’avenir. Si tout ce que vous pouvez faire est de pointer les gens vers une page qui contient la réponse quelque part dessus et qui contient potentiellement des solutions incorrectes, cela n’aidera personne.
Et oui, il pourrait y avoir des moyens dans Discourse de mettre en évidence les solutions, par exemple le plugin Solved, mais mon forum a 22 ans de messages dont seulement les 12 derniers mois ont été créés dans Discourse.
Discouse n’utilise pas Apache2. Il peut être utilisé devant Discourse comme proxy inverse, mais est loin d’être optimal dans ce cas.
Et je ne comprends pas du tout ce sujet. Cette structure d’URL n’a rien à voir avec le SEO. Mais peut-être que la raison est que je ne comprends pas — mais mon forum a toujours une valeur SEO assez élevée, mais elle provient du contenu.