Suppression des liens /2, /3, /4, etc. pour chaque réponse dans une URL de sujet

RGJ · Novembre 23, 2021, 10:46

Non, /8 n’est pas la même chose que le sujet. /8 pointe vers le 8ème message et l’horodatage correspond à celui du 8ème message.

Si vous comparez la variante ?page=2 au message réel auquel elle renvoie, vous obtiendrez les mêmes horodatages.
Par exemple :

wget -q -O - https://meta.discourse.org/t/topic-list-previews-legacy/101646/959|grep published_ti

<meta property="article:published_time" content="2020-05-09T04:29:46+00:00" />
wget -q -O - https://meta.discourse.org/t/topic-list-previews-legacy/101646/?page=2|grep published_ti

<meta property="article:published_time" content="2020-05-09T04:29:46+00:00" />

Il semble que oui : Incorrect or failing oneboxes for links to other discourse instances - #14 by techAPJ

j127 · Novembre 24, 2021, 12:58

Je ne dis pas de supprimer les informations temporelles, mais simplement qu’il serait préférable de n’envoyer que l’horodatage lisible par machine pour la publication principale. Du point de vue du classement d’une page dans les résultats de recherche, un sujet de forum est essentiellement un article (publication principale) avec une série de commentaires. Il n’importe pas à un moteur de recherche quand les commentaires ont été faits.

Mise à jour : une autre façon de transmettre la date à Google pour un commentaire (par opposition à la page entière) est le balisage schema.org.

Bien sûr, /8 pointe vers la 8ème publication, mais du point de vue d’un bot et de Google, il s’agit exactement du même contenu et de la même URL. Si vous voulez que Google sache que /8 doit être traité exactement de la même manière que le sujet dans les résultats de recherche, alors le site ne devrait pas envoyer de signal intentionnel indiquant qu’ils sont différents. Seul l’utilisateur humain a besoin de savoir que les horodatages sont différents, et cette information est imprimée dans le texte de la page.

Si quelqu’un chez Google doit prendre des décisions sur le moment de remplacer les URL canoniques définies par le site, l’une de ces exceptions pourrait être quelque chose comme “deux horodatages différents dans les métadonnées intentionnelles signifient des pages différentes – par conséquent, remplacer l’URL canonique.”

Il est souvent difficile pour les programmeurs de penser à tous les cas limites, sauf s’ils ont l’expérience de rencontrer cette chose, il peut donc être inconcevable pour les programmeurs de Google que des pages identiques puissent avoir deux horodatages différents, même s’il est facile pour les utilisateurs de Discourse de comprendre pourquoi cela pourrait se produire.

J’ai travaillé dans une entreprise où une partie de mon travail consistait à faire désindexer des sites de Google. (Ils ne faisaient rien de louche, mais il y avait des problèmes techniques.) Comme personne ne savait exactement comment fonctionne la technologie de classement de Google, et qu’elle change régulièrement, le point de départ était d’essayer de penser comme un ingénieur de recherche et de supprimer tout ce qui pourrait être ambigu ou déroutant pour les machines. Je ne pouvais jamais dire exactement quelle chose fonctionnait, mais cela fonctionnait toujours après un certain temps à corriger systématiquement des choses comme ça.

Falco · Novembre 25, 2021, 9:26

C’est inclus. Si vous souhaitez activer cette fonctionnalité expérimentale, vous devez modifier la valeur du paramètre de site caché SiteSetting.allow_indexing_non_canonical_urls.

Veuillez partager les résultats avec nous.

SethWilliams · Novembre 26, 2021, 12:40

Ça me semble tout à fait logique.

j127:

Bien sûr, /8 pointe vers le 8ème message, mais du point de vue d’un bot et de Google, c’est exactement le même contenu et la même URL. Si vous voulez que Google sache que /8 doit être traité exactement de la même manière que le sujet dans les résultats de recherche, alors le site ne devrait probablement pas envoyer un signal intentionnel qu’ils sont différents. Seul l’utilisateur humain a besoin de savoir que les horodatages sont différents, et cette information est imprimée dans le texte de la page.

Si quelqu’un chez Google doit prendre des décisions sur le moment de remplacer les URL canoniques définies par le site, l’une de ces exceptions pourrait être quelque chose comme “deux horodatages différents dans les métadonnées intentionnelles signifient des pages différentes - par conséquent, remplacez l’URL canonique”.

Il est souvent difficile pour les programmeurs de penser à tous les cas limites, sauf s’ils ont l’expérience de rencontrer cette chose, il peut donc être inconcevable pour les programmeurs de Google que des pages identiques puissent avoir deux horodatages différents, même s’il est facile pour les utilisateurs de Discourse de comprendre pourquoi cela pourrait se produire.

Oui, oui, et oui. Bien articulé.

Falco · Février 21, 2022, 8:46

Voir

rrit · Février 22, 2022, 12:14

Actuellement, Google utilise correctement les URL canoniques :
Nous pouvons superviser cela via la Google Search Console avec le rapport « Index » → « Couverture » → « Page alternative avec une balise canonique appropriée »

À propos de Page alternative avec une balise canonique appropriée :
« Cette page est un doublon d’une page que Google reconnaît comme canonique. Cette page pointe correctement vers la page canonique, il n’y a donc rien à faire pour vous. »

rahim123 · Juillet 26, 2023, 1:42

Je n’ai aucune idée de la façon dont les liens /X pour chaque réponse affectent le référencement, et j’essaie généralement d’éviter de céder aux caprices de Google. Mais d’un point de vue pratique, je constate que Google ne détecte pas les nouvelles réponses dans de nombreux sujets de longue date sur mon forum Discourse, alors qu’il indexe rapidement la plupart des nouveaux sujets. Et lorsqu’il indexe une nouvelle réponse, le lien ne mène pas à la réponse spécifique mais plutôt à /XXXX?page=YY. Je n’ai aucune idée si c’est bon pour le référencement, mais ce n’est certainement pas bon pour les utilisateurs humains qui recherchent quelque chose de spécifique.

SethWilliams · Janvier 20, 2024, 1:29

Ce sujet est resté silencieux pendant un bon moment. Je me demandais : quelqu’un a-t-il testé cette fonctionnalité expérimentale ? Maintenant que plus de deux ans se sont écoulés, j’aimerais savoir si elle est toujours considérée comme expérimentale ou si quelqu’un peut confirmer qu’elle résout le problème ?

Semblable à ce que @RGJ avait fait en novembre 21, j’ai trouvé un grand forum public (Python) qui utilise Discourse et j’ai effectué une recherche Google pour un sujet dans leur forum avec de nombreuses réponses pour voir s’il afficherait une foule de réponses individuelles du même sujet.

À ma grande joie, Google ne m’a PAS montré une longue liste de réponses individuelles dans les résultats ! Les seuls résultats étaient le sujet lui-même et la catégorie dans laquelle il se trouve ! C’est un EXCELLENT signe !

Cependant, lorsque je fais la même recherche que @RGJ a faite en novembre 21, le problème persiste avec cette recherche spécifique.

J’ai également effectué une nouvelle recherche de test avec un autre sujet sur ce forum communautaire Discourse, et j’ai trouvé un problème similaire, avec plusieurs résultats provenant du même sujet.

C’est formidable de voir que ce problème n’existe pas toujours avec tous les forums Discourse… mais je ne comprends pas pourquoi le problème serait résolu avec le forum Python alors qu’il existe toujours dans le forum Discourse.

Quelqu’un a-t-il des idées sur la façon de résoudre ce problème ?

J’envisage de migrer un forum existant de NodeBB vers Discourse, mais avant de le faire, je dois savoir s’il existe un moyen de résoudre ce problème afin qu’il ne crée pas un cauchemar SEO pour notre domaine.

packman · Janvier 20, 2024, 8:37

Cette recherche renvoie un petit nombre de liens vers le sujet, mais le sujet contient 58 messages, vous vous attendriez donc à voir 58 résultats individuels si les URL /nn étaient toutes indexées. Il est possible que le robot d’indexation voie des liens vers des messages dans le sujet dans d’autres messages, il indexe donc ces pages individuelles ?

Cela dit, désactiver /nn serait un cauchemar pour mon forum. Il y a souvent de longues discussions sur la façon de résoudre les problèmes qui peuvent contenir plusieurs solutions, celle-ci semble fonctionner, suivie quelques messages plus tard par un message « oh non, ça ne fonctionne pas ». Nous nous référons souvent aux messages de « correction » réels lorsque quelqu’un d’autre a ce problème à l’avenir. Si tout ce que vous pouvez faire est de pointer les gens vers une page qui contient la réponse quelque part dessus et qui contient potentiellement des solutions incorrectes, cela n’aidera personne.

Et oui, il pourrait y avoir des moyens dans Discourse de mettre en évidence les solutions, par exemple le plugin Solved, mais mon forum a 22 ans de messages dont seulement les 12 derniers mois ont été créés dans Discourse.

Heavy_Ender · Octobre 12, 2024, 10:51

Salut Seth !
Je rencontre actuellement le même problème sur mon projet.
J’ai plusieurs URL pour une seule page car elle est paginée.

Je pense que cette publication peut être utile.
J’ai réussi à utiliser ce code pour rediriger toutes mes pages paginées vers leur page canonique.

j127 · Octobre 12, 2024, 11:54

Avez-vous mis ce code dans un fichier .htaccess pour rediriger les pages dans Discourse ?

Jagster · Octobre 13, 2024, 5:44

Discouse n’utilise pas Apache2. Il peut être utilisé devant Discourse comme proxy inverse, mais est loin d’être optimal dans ce cas.

Et je ne comprends pas du tout ce sujet. Cette structure d’URL n’a rien à voir avec le SEO. Mais peut-être que la raison est que je ne comprends pas — mais mon forum a toujours une valeur SEO assez élevée, mais elle provient du contenu.

David_Ghost · Octobre 13, 2024, 1:51

Je pense que le problème ici est le budget d’exploration.

Jagster · Octobre 13, 2024, 3:03

Non, pas ça non plus.

Sujet		Réponses	Vues
Search engines now blocked from indexing non-canonical pages Announcements seo	23	4447	Mars 15, 2022
Sitelinks in Google disappearing Community Building	26	1584	Janvier 27, 2023
Why isn't Google Indexing Discourse? SEO concerns Support seo	31	5641	Juin 1, 2024
Adding Canonical Redirects for SEO Optimization Support	23	7498	Octobre 1, 2015
Pagination URL scheme not passed through when topic is renamed Feature	21	4106	Mai 20, 2015

Suppression des liens /2, /3, /4, etc. pour chaque réponse dans une URL de sujet

Sujets connexes