Strategien zur Behebung von Konflikten mit indexierten URLs in Discourse

Hallo zusammen,
Ich betreibe ein Discourse-Forum und benötige Hilfe bei einem größeren SEO- + Indexierungsproblem nach einem Neuaufbau.

Was passiert ist:

  • Mein ursprüngliches Discourse-Forum ist abgestürzt, und ich habe etwa 10.000 Themen verloren.

  • Ich habe das Forum von Grund auf neu aufgebaut, wobei ich die gleiche Domain und die gleiche Google Search Console (GSC)-Property beibehalten habe.

  • Da Discourse inkrementelle Themen-IDs verwendet, verwenden die neu erstellten Themen jetzt alte Themen-IDs wieder (z. B. gehörte /t/783 zuvor zu einem gelöschten Thema, und jetzt ist es einem neuen zugewiesen).

Aktuelle Probleme:

  1. GSC zeigt über **12.000 „Gecrawlt – Nicht indexiert“-**URLs an.

  2. Alte Themen-URLs wie /t/altes-thema-titel/783 sind immer noch indexiert oder werden gecrawlt.

  3. Diese URLs verweisen jetzt auf neue Inhalte (z. B. /t/neues-thema-titel/783), was zu Titelabweichungen bei der Suche führt und möglicherweise Duplicate/Thin Content-Strafen auslöst.

  4. Einige alte Themen-URLs werden immer noch bereitgestellt (nicht 404 oder 410) und werden mit aktuellen Themen zusammengeführt, die dieselbe ID haben.

  5. Die Sitemap enthält wiederverwendete IDs, was die Crawler zusätzlich verwirrt.

Was soll ich tun, um das Problem zu lösen?

In PostgreSQL könnten Sie die topics_id_seq-Sequenz manuell auf einen hohen Wert setzen, z. B. 20000, damit neue Themen mit dieser Nummer beginnen:

SELECT setval('topics_id_seq', 20000, false);

Haben Sie den Server selbst verloren? :cry:

2 „Gefällt mir“

Ja, die ganze Datenbank auch.

Ich habe also eine neue erstellt, die bereits etwa 6000 Themen hat. Soll ich sie von nun an ab 20.000 erstellen?

Idealerweise hättest du das gleich nach der Erstellung der neuen Seite getan, aber jetzt ist es zu spät.

Besser spät als nie - wenn diese Sequenz derzeit bei 6000 liegt und du sie auf 20000 setzt, hat das nächste neue Thema die ID 20000 anstelle von 6000.

1 „Gefällt mir“

Wäre es also wie 1-5999 und dann 2000 und so weiter? Richtig? Und hoffentlich verursacht das keine Probleme in späteren Phasen?

Oder soll ich das einfach lassen und mit der Zeit würden neue Themen die alten überschreiben?

Der Ratschlag bezieht sich auf Ihre Beschwerde, dass alte Themen-IDs “wiederverwendet” werden. Wenn Sie diese Sequenz auf 20000 erhöhen, wird verhindert, dass Themen zwischen 6000 und 19999 erstellt werden.

3 „Gefällt mir“

Ja, nehmen wir an, es wird sogar mit der Zeit überschrieben, wie z. B. mit 6000 und so weiter mit neuen Themen-URLs. Wird dies kein Problem verursachen, oder kann es in Zukunft etwas kaputt machen?