Entfernen der /2, /3, /4 usw. Links für jede Antwort innerhalb einer Themen-URL

Nein, /8 ist nicht dasselbe wie das Thema. /8 verweist auf den 8. Beitrag und der Zeitstempel entspricht dem des 8. Beitrags.

Wenn Sie die ?page=2-Variante mit dem tatsächlichen Beitrag vergleichen, zu dem sie verlinkt, erhalten Sie dieselben Zeitstempel.
Zum Beispiel:

wget -q -O - https://meta.discourse.org/t/topic-list-previews-legacy/101646/959|grep published_ti

<meta property="article:published_time" content="2020-05-09T04:29:46+00:00" />
wget -q -O - https://meta.discourse.org/t/topic-list-previews-legacy/101646/?page=2|grep published_ti

<meta property="article:published_time" content="2020-05-09T04:29:46+00:00" />

Sieht so aus: Incorrect or failing oneboxes for links to other discourse instances - #14 by techAPJ

3 „Gefällt mir“

Ich sage nicht, dass die Zeitinformationen entfernt werden sollen, sondern nur, dass es besser wäre, nur den maschinenlesbaren Zeitstempel für den Hauptbeitrag zu senden. Aus der Perspektive der Rangfolge einer Seite in Suchergebnissen ist ein Forenthema im Grunde ein Artikel (Hauptbeitrag) mit einer Reihe von Kommentaren dazu. Für eine Suchmaschine spielt es keine Rolle, wann die Kommentare gemacht wurden.

Bearbeitung: Eine weitere Möglichkeit, das Datum an Google für einen Kommentar (im Gegensatz zur gesamten Seite) zu übergeben, ist die schema.org-Markup.

Sicher, /8 verweist auf den 8. Beitrag, aber aus der Sicht eines Bots und aus der Sicht von Google ist es exakt derselbe Inhalt und dieselbe URL. Wenn Sie möchten, dass Google weiß, dass /8 in den Suchergebnissen exakt genauso behandelt werden soll wie das Thema, dann sollte die Website wahrscheinlich kein absichtliches Signal senden, dass sie unterschiedlich sind. Nur der menschliche Benutzer muss wissen, dass die Zeitstempel unterschiedlich sind, und diese Information wird im Text auf der Seite angezeigt.

Wenn jemand bei Google Entscheidungen treffen muss, wann er seitendefinierte kanonische URLs überschreibt, könnte eine dieser Ausnahmen etwas sein wie „zwei unterschiedliche Zeitstempel in den absichtlichen Metadaten bedeuten unterschiedliche Seiten – daher die kanonische URL überschreiben“.

Für Programmierer ist es oft schwierig, alle Randfälle zu bedenken, es sei denn, sie haben Erfahrung damit, diese Sache zu erleben. Daher mag es für die Google-Programmierer unvorstellbar sein, dass identische Seiten zwei unterschiedliche Zeitstempel haben könnten, obwohl es für Discourse-Benutzer einfach zu verstehen ist, warum das passieren könnte.

Ich habe früher bei einem Unternehmen gearbeitet, wo es Teil meiner Aufgabe war, Websites von Google entbannen zu lassen. (Sie haben nichts zwielichtiges getan, aber es gab einfach technische Probleme.) Da niemand genau wusste, wie die Ranking-Technologie von Google funktioniert und sich diese regelmäßig ändert, war der Ausgangspunkt, zu versuchen, wie ein Suchmaschinen-Ingenieur zu denken und alles zu entfernen, was für Maschinen potenziell mehrdeutig oder verwirrend sein könnte. Ich konnte nie genau sagen, welche Sache funktionierte, aber es funktionierte immer nach einiger Zeit des systematischen Behebens solcher Dinge.

5 „Gefällt mir“

[quote=“Falco, post:5, topic:209648”]einen X-Robots-Tag: noindex-Header zur Antwortnutzlast dieser Seiten hinzuzufügen.
[/quote]

Das ist drin. Wenn Sie diese experimentelle Funktion aktivieren möchten, müssen Sie den Wert auf die versteckte Website-Einstellung SiteSetting.allow_indexing_non_canonical_urls umstellen.

Bitte teilen Sie uns die Ergebnisse mit.

8 „Gefällt mir“

Das ergibt für mich vollkommen Sinn.

Ja, ja und ja. Gut formuliert.

3 „Gefällt mir“

Siehe

9 „Gefällt mir“

Derzeit verwendet Google die kanonischen URLs korrekt:
Wir können dies über die Google Search Console mit dem Bericht „Index“ → „Abdeckung“ → „Alternative Seite mit korrektem Canonical-Tag“ überwachen.

Über Alternative Seite mit korrektem Canonical-Tag:
„Diese Seite ist eine Duplikatseite, die Google als kanonisch erkennt. Diese Seite verweist korrekt auf die kanonische Seite, sodass Sie nichts weiter tun müssen.“ :slight_smile:

4 „Gefällt mir“

Ich habe keine Ahnung, wie sich die /X-Links für jede Antwort auf SEO auswirken, und ich versuche generell, mich nicht den Launen von Google zu beugen. Aber aus praktischer Sicht sehe ich, dass Google in vielen lang laufenden Themen auf meinem Discourse-Forum keine neuen Antworten aufnimmt, während es die meisten neuen Themen schnell indiziert. Und wenn es eine neue Antwort indiziert, führt der Link nicht zur spezifischen Antwort, sondern zu /XXXX?page=YY. Ich habe keine Ahnung, ob das gut für SEO ist, aber es ist definitiv nicht gut für menschliche Benutzer, die nach etwas Bestimmtem suchen.

Diese Diskussion ist schon eine Weile ruhig. Ich war neugierig: Hat jemand diese experimentelle Funktion getestet? Da nun über zwei Jahre vergangen sind, würde ich gerne wissen, ob dies immer noch als Experiment gilt oder ob jemand bestätigen kann, dass es das Problem behebt?

Ähnlich wie @RGJ es im November '21 getan hat, habe ich ein großes öffentliches Forum (Python) gefunden, das Discourse verwendet, und eine Google-Suche nach einem Thema in ihrem Forum mit vielen Antworten durchgeführt, um zu sehen, ob eine Vielzahl einzelner Antworten aus demselben Thema angezeigt wird.

Zu meiner Freude hat Google mir KEINE große Liste einzelner Antworten in den Ergebnissen angezeigt! Die einzigen Ergebnisse waren das Thema selbst und dann die Kategorie, in der es sich befindet! Das ist ein GROSSARTIGES Zeichen!

Wenn ich jedoch dieselbe Suche durchführe, die @RGJ im November '21 durchgeführt hat, besteht das Problem bei dieser spezifischen Suche weiterhin.

Ich habe auch eine neue Testsuche mit einem anderen Thema in dieser Discourse-Community durchgeführt und ein ähnliches Problem festgestellt, mit mehreren Ergebnissen, die aus demselben Thema stammten.

Es ist großartig zu sehen, dass dieses Problem nicht immer bei allen Discourse-Foren auftritt … aber ich verstehe nicht, warum das Problem mit dem Python-Forum gelöst wäre, während es im Discourse-Forum weiterhin besteht.

Hat jemand Ideen, wie dieses Problem behoben werden kann?

Ich erwäge, ein bestehendes Forum von NodeBB nach Discourse zu migrieren, aber bevor ich das tue, muss ich wissen, ob es eine Möglichkeit gibt, dies zu beheben, damit es keinen SEO-Albtraum für unsere Domain verursacht.

4 „Gefällt mir“

Diese Suche liefert eine kleine Anzahl von Links zum Thema, aber das Thema hat 58 Beiträge, sodass man 58 einzelne Ergebnisse erwarten würde, wenn die /nn-URLs alle indiziert würden. Es ist möglich, dass der Spider Links zu Beiträgen im Thema in anderen Beiträgen sieht, sodass er diese einzelnen Seiten indiziert?

Davon abgesehen wäre das Deaktivieren von /nn ein Albtraum für mein Forum. Es gibt oft lange Diskussionen darüber, wie Probleme gelöst werden können, die mehrere enthalten. Dies scheint zu funktionieren, gefolgt von einem Beitrag “Oh nein, das tut es nicht” ein paar Beiträge später. Wir verweisen oft auf tatsächliche “Fix”-Beiträge, wenn jemand anderes in Zukunft dasselbe Problem hat. Wenn Sie die Leute nur auf eine Seite verweisen können, die die Antwort irgendwo enthält, und diese möglicherweise falsche Lösungen enthält, wird das niemandem helfen.

Und ja, es gibt vielleicht Discourse-Möglichkeiten, Lösungen hervorzuheben, z. B. das Solved-Plugin, aber mein Forum hat 22 Jahre an Beiträgen, von denen nur die letzten 12 Monate in Discourse erstellt wurden.

3 „Gefällt mir“

Hallo Seth!
Ich stehe gerade vor demselben Problem in meinem Projekt.
Ich habe mehrere URLs für eine einzige Seite, da diese paginiert ist.

Ich denke, dieser Beitrag könnte hilfreich sein.
Ich habe diesen Code verwendet, um alle meine paginierten Seiten auf ihre kanonische Seite umzuleiten.

Haben Sie diesen Code in eine .htaccess-Datei eingefügt, um Seiten in Discourse umzuleiten?

Discourse verwendet nicht Apache2. Es kann vor Discourse als Reverse Proxy verwendet werden, ist aber weit davon entfernt, optimal zu sein.

Und ich verstehe dieses Thema überhaupt nicht. Diese URL-Struktur hat nichts mit SEO zu tun. Aber vielleicht liegt es daran, dass ich es nicht verstehe – aber mein Forum hat immer noch einen ziemlich hohen SEO-Wert, der jedoch vom Inhalt herrührt.

3 „Gefällt mir“

Ich denke, das Problem hier ist das Crawl-Budget.

Nein, das auch nicht.