Stratégies pour résoudre les conflits d'URL indexées dans Discourse

Bonjour à tous,
Je gère un forum Discourse et j’ai besoin d’aide concernant un problème majeur de référencement (SEO) et d’indexation après une reconstruction.

Ce qui s’est passé :

  • Mon forum Discourse d’origine a planté, et j’ai perdu environ 10 000 sujets.

  • J’ai reconstruit le forum à partir de zéro, en conservant le même domaine et la même propriété Google Search Console (GSC).

  • Étant donné que Discourse utilise des identifiants de sujets incrémentiels, les sujets nouvellement créés réutilisent maintenant d’anciens identifiants de sujets (par exemple, /t/783 appartenait auparavant à un sujet supprimé, et maintenant il est attribué à un nouveau).

Problèmes actuels :

  1. GSC affiche plus de 12 000 URL “Explorées - Non indexées”.

  2. Les anciennes URL de sujets comme /t/ancien-titre-de-sujet/783 sont toujours indexées ou en cours d’exploration.

  3. Ces URL pointent maintenant vers un nouveau contenu (par exemple, /t/nouveau-titre-de-sujet/783), ce qui provoque des incompatibilités de titres dans la recherche et déclenche potentiellement des pénalités pour contenu dupliqué/faible.

  4. Certaines anciennes URL de sujets sont toujours servies (pas 404 ou 410) et fusionnent avec les sujets actuels qui ont le même identifiant.

  5. Le plan du site comprend des identifiants réutilisés, ce qui embrouille davantage les robots d’exploration.

Que dois-je faire pour résoudre ce problème ?

Dans postgres, vous pourriez définir manuellement la séquence d’ID de sujet à une valeur élevée, par exemple 20000, afin que les nouveaux sujets commencent à ce numéro :

SELECT setval('topics_id_seq', 20000, false);

Vous avez perdu le serveur lui-même ? :cry:

2 « J'aime »

Oui, toute la base de données aussi.

Donc, j’en ai créé une nouvelle, donc elle a déjà environ 6000 sujets, donc devrais-je à partir de maintenant la faire à partir de 20k ?

Idéalement, vous auriez dû le faire dès la création du nouveau site, mais il est trop tard maintenant.

Mieux vaut tard que jamais - si cette séquence est actuellement à 6000 et que vous la définissez à 20000, le prochain nouveau sujet aura l’ID 20000 au lieu de 6000.

1 « J'aime »

Donc ce serait comme 1-5999 puis 2000 et ainsi de suite ? N’est-ce pas ? Et espérons que cela ne causera aucun problème aux étapes ultérieures ?

Ou devrais-je simplement laisser cela et avec le temps, les nouveaux sujets écraseraient les anciens ?

Le conseil répond à votre plainte concernant la “réutilisation” des anciens identifiants de sujet. Augmenter cette séquence jusqu’à 20000 empêchera la création de sujets entre 6000 et 19999.

3 « J'aime »

Oui, disons que même si elle écrase avec le temps, comme 6000 et ainsi de suite avec de nouvelles URLs de sujets, cela ne causera aucun problème, ou cela pourrait-il casser quelque chose à l’avenir.