Discourse SEO-Übersicht (Sitemap / robots.txt)

Discourse bietet viele SEO-Funktionen, die sofort einsatzbereit sind. Mit unseren sinnvollen Standardeinstellungen können sich Community-Manager auf den Aufbau einer Community konzentrieren und sollten sich nicht durch die Optimierung für Suchmaschinen abgelenkt fühlen. Dennoch gibt es einige Dinge, die Sie ändern können, einige Dinge, die Sie wissen sollten, und einige allgemeine Tipps und Tricks unten.

Hier ist ein Vergleich dessen, was ein Benutzer sieht und was eine Suchmaschine sieht:

Themenliste:

Thema:

Meta-Tags

In Discourse werden die generischen Meta-Tags, die für SEO unerlässlich sind, automatisch basierend auf dem Inhalt der Seite generiert. Das Title-Tag wird beispielsweise vom Seiten- oder Thema-Titel abgeleitet, und die Beschreibung wird aus dem Inhalt des ersten Beitrags generiert. Die Anpassung von Metadaten pro Seite ist jedoch begrenzt. Um diese Werte zu ändern, müssen Sie die Einstellungen oder die Inhaltsfelder ändern, aus denen sie generiert werden.

  • Die Website-Einstellungen Titel, Beschreibung und Kurzbeschreibung der Website
  • Die Kategorienamen
  • Die Titel und Inhalte der Beiträge
  • Und so weiter :technologist:

URL-Struktur und Kodierung

Nicht-lateinische Zeichen und URLs

Discourse entfernt standardmäßig nicht-lateinische Zeichen aus Themen-URLs, wenn die Locale auf EN eingestellt ist. Um dies zu vermeiden, können Sie die Locale auf die primäre nicht-lateinische Sprache ändern oder die Einstellung slug generation method von ASCII auf encoded ändern.

Unterordner vs. Unterverzeichnis-Einrichtung

Discourse bevorzugt Unterverzeichnisse gegenüber Unterordnern aufgrund seiner technischen Einfachheit. Google hat keine wirkliche Präferenz zwischen den beiden[1], aber Discourse empfiehlt dringend, Unterordner-Einrichtungen zu vermeiden, es sei denn, Sie verfügen über tiefgreifende technische Kenntnisse.

Canonicalisierung

Google ist daran interessiert, kanonische Versionen von Seiten zu indizieren. In Discourse wird für ein Thema mit mehreren Antworten der kanonische Link (der erste Beitrag) an Google übergeben, das dann über die Indizierung entscheidet. Themen mit mehr als 20 Beiträgen werden paginiert, wobei jede Seite ein kanonischer Link mit bis zu 20 Beiträgen ist.
Zum Beispiel wird der kanonische Tag für die letzte Antwort in diesem Thema https://meta.discourse.org/t/try-out-the-new-sidebar-and-notification-menus/238821?page=12 sein.

Schema-Markup

Wir verwenden Schema.org-Markup, um Inhalte in Suchmaschinen durch Breadcrumbs zu kategorisieren. Der Kategoriename in einem Themen-Slug ist enthalten:

Sitemap

Discourse enthält eine Sitemap unter /sitemap.xml, die standardmäßig über die Einstellung enable sitemap aktiviert ist. Dies erleichtert die Indizierung durch Suchmaschinen.

Statische Ansicht für Suchmaschinen

Discourse verfügt über eine statische HTML-Ansicht ohne JavaScript, damit Web-Crawler Ihre Website schneller indizieren können. Der Inhalt zwischen der dynamischen und der statischen Ansicht ist identisch und es werden keine Inhalte ausgelassen oder entfernt, wenn die Website von Suchmaschinen gecrawlt wird.

Mögliche Probleme mit Web-Crawlern

Web-Crawler, auch Robots genannt, sind für die Indizierung von Webseiten unerlässlich. Einige Crawler können jedoch übermäßig enthusiastisch sein und das Forum mit vielen Anfragen belasten. Discourse blockiert standardmäßig mehrere berüchtigte Crawler, erlaubt Ihnen aber, die Einstellung blocked crawler user agents bei Bedarf anzupassen.

robots.txt

Sie können robots.txt[2] einsehen und bei Bedarf bearbeiten. Diese Datei dient als Werkzeug, um Web-Crawlern zu leiten, wie sie mit den Forum-Inhalten interagieren sollen. Ihr Hauptzweck ist die Verwaltung des Crawler-Zugriffs, die Verhinderung einer Überlastung des Servers und die Aufrechterhaltung der SEO-Gesundheit der Website, indem die Indizierung von Inhalten geringen Werts oder sich wiederholenden Seiten vermieden wird.

:warning: Das Ändern dieser Datei ohne sorgfältige Überlegung kann die Indizierung Ihrer Website beeinträchtigen.

Migrationen und URL-Weiterleitungen

Die Permalink-Funktion wird verwendet, um alte URLs weiterzuleiten, um SEO zu erhalten, „Seite nicht gefunden“-Fehler zu vermeiden und Suchmaschinen mit den richtigen Metadaten für eine einfachere Indizierung zu unterstützen.
Wenn Ihre Community-Website von unserem Team nach Discourse migriert wird, sind die URL-Weiterleitungen enthalten, es sei denn, es gibt triftige Gründe, dies nicht zu tun.
Wenn Sie eines der bestehenden Import-Skripte verwenden, sollten Sie sicherstellen, dass das Skript dies behandelt[3]. Sie können Permalinks manuell über Ihr Admin-Panel unter AnpassenPermalinks hinzufügen.

Diskrepanz zwischen Discourse-Seitenaufrufen und Google Analytics

Discourse und Google Analytics haben unterschiedliche Methoden zur Zählung von Seitenaufrufen, was oft zu einer höheren Anzahl von Seitenaufrufen in Discourse führt. Dieser Unterschied ergibt sich daraus, dass Discourse eine Single-Page-Anwendung ist und somit jede signifikante Anfrage als Seitenaufruf zählt.
Google hingegen verwendet JavaScript, um Seitenaufrufe nur beim vollständigen Laden der Seite zu zählen und Web-Crawler standardmäßig auszuschließen. Im Gegensatz zu Google zählt Discourse rohe Anfragen und gibt Seitenaufrufe beim ersten Laden einer Seite oder beim Übergang zwischen Routen aus, wodurch sich die Tracking-Mechanismen voneinander unterscheiden.

Wenn Sie mehr über Datenberichte und Analysen erfahren möchten, schauen Sie sich die entsprechende Kategorie an:

De-Indizierungsmethoden

Um Seiten aus dem Google-Index zu entfernen, können Sie entweder Inhalte entfernen oder den Zugriff auf eine Seite blockieren. Je nach Bedarf können Sie Ihre gesamte Website privat machen [4]. Sie können Themen ausschließen, indem Sie sie löschen oder in eingeschränkte Kategorien verschieben. Versteckte Themen werden standardmäßig nicht indiziert, können aber indiziert werden, wenn es irgendwo einen öffentlichen Link gibt, der darauf umleitet.
Für eine dauerhafte Entfernung ist die Verwendung des Tools „Entfernungen“ in der Google Search Console der richtige Weg, um Seiten aus den Suchergebnissen herauszuhalten.
Erfahren Sie mehr unter Remove information on your website from Google - Search Console Help.


  1. Sie können mehr darüber unter Secure Uploads lesen. ↩︎

  2. Suchen Sie nach der Einstellung „allow index in robots txt“. ↩︎

  3. Wenn Sie nach dem String permalink im Import-Skript suchen, erhalten Sie diese Informationen. ↩︎

  4. Suchen Sie nach der Einstellung login required. ↩︎

19 „Gefällt mir“

Vielen Dank für diese detaillierte SEO-Übersicht für Discourse! Als SEO-Experte, der mit verschiedenen Plattformen arbeitet, finde ich es sehr hilfreich zu sehen, wie Discourse wesentliche Elemente wie sitemap.xml und robots.txt handhabt. Das Standard-Setup ist recht SEO-freundlich, aber ich bin neugierig, ob es Best Practices oder Plugin-Empfehlungen gibt, um die Indexierungskontrolle oder die Schema-Markup-Integration in Discourse-Foren weiter zu verbessern.

Ich freue mich darauf, mehr von der Community zu lernen und meinen Beitrag zu leisten, wo ich kann!

2 „Gefällt mir“