Hallo! Wir bei NLnet Labs haben Discourse für unsere Produkte eingerichtet (community.nlnetlabs.nl). Ein Benutzer fragte nach dem Abrufen des RSS-Feeds für ein bestimmtes Thema (z. B. https://community.nlnetlabs.nl/c/cascade/10), da sein RSS-Reader ihn nicht finden konnte.
Ich habe versucht, diese themenspezifische Seite mit meinem bevorzugten RSS-Feed-Reader zu verwenden, und er fand zwei Feeds: „NLnet Labs Community - Latest Posts“ (/posts.rss) und „NLnet Labs Community - Latest topics“ (/latest.rss). Ich weiß, dass /c/cascade/10.rss ein gültiger RSS-Feed ist, aber mein Reader konnte ihn nicht automatisch finden. Das ist etwas frustrierend, da wir anfangen müssen, diese URLs selbst mitzuteilen.
Ich habe die automatische RSS-Feed-Erkennung für meine persönliche Website untersucht, daher habe ich einige Erfahrung damit. Ich habe den <head> der Webseite überprüft; mir fielen die folgenden Links auf:
<link rel="alternate" type="application/rss+xml" title="Latest posts" href="https://community.nlnetlabs.nl/posts.rss">
<link rel="alternate" type="application/rss+xml" title="Latest topics" href="https://community.nlnetlabs.nl/latest.rss">
<link rel="alternate nofollow" type="application/rss+xml" title="RSS feed of topics in the 'Cascade' category" href="https://community.nlnetlabs.nl/c/cascade/10.rss">
Der <head> enthält also tatsächlich einen dritten Link für den themenspezifischen RSS-Feed; aber es scheint, dass einige RSS-Feed-Reader das Attribut rel=”nofollow” nicht mögen.
Natürlich habe ich MDN überprüft (HTML attribute: rel - HTML | MDN); nofollow wird dokumentiert als:
Zeigt an, dass der ursprüngliche Autor oder Herausgeber des aktuellen Dokuments die referenzierte Ressource nicht befürwortet.
Aber auch:
Relevant für
<form>,<a>und<area>teilt das SchlüsselwortnofollowSuchmaschinen-Spiders mit, die Link-Beziehung zu ignorieren. Die nofollow-Beziehung kann angeben, dass der Eigentümer des aktuellen Dokuments die referenzierte Ressource nicht befürwortet. Es wird oft von Suchmaschinenoptimierern eingefügt, die ihre Linkfarmen als Spam-Seiten ausgeben.
Ich habe den Discourse-Quellcode auf GitHub durchsucht und mit einigen Suchen und Git Blame konnte ich FEATURE: add nofollow to RSS alternate link in topics and categories by rr-it · Pull Request #16013 · discourse/discourse · GitHub finden. Ich vermute also, dass die zweite Bedeutung für rel=”nofollow” hier beabsichtigt war. Wenn man der Hintergrunddiskussion folgt, scheint es hilfreich zu sein, die Priorisierung bei Web-Crawlern zu steuern. Es gab eine zusätzliche Nachverfolgung in Search engines now blocked from indexing non-canonical pages - #4 by rrit, aber ich konnte nicht herausfinden, ob rel=\"nofollow” immer noch wichtig ist.
Ich konnte keine Diskussion auf Discourse Meta zu diesem Problem finden, obwohl der PR bereits 2022 zusammengeführt wurde. Offensichtlich gibt es ein Missverständnis bei den Konventionen rund um <link>s für RSS-Feeds, zwischen einigen RSS-Feed-Readern und Discourse. Daher frage ich:
- Dient
rel=”nofollow”immer noch seinem ursprünglichen Zweck zur Verbesserung der Priorisierung von Web-Crawlern, oder wurde es durch andere Techniken ersetzt? - Scheint dieses Verhalten (d. h. das Ignorieren von
rel=”nofollow”-Links) bei der automatischen Erkennung von RSS-Feeds üblich zu sein? Können andere dies reproduzieren? Mir ist kein maßgeblicher Standard für die automatische Erkennung von RSS-Feeds bekannt. - Besteht die Bereitschaft, diesen Anwendungsfall zu unterstützen, damit RSS-Feed-Reader die richtigen Beiträge automatisch erkennen können? Die Existenz dieser themenspezifischen
<link>s, auch wenn sie von meinem Reader nicht verwendet werden, lässt mich das vermuten; vielleicht wurde der Funktionsverlust einfach übersehen, alsrel=”nofollow”hinzugefügt wurde.
An die Discourse-Entwickler: Vielen Dank für die Entwicklung!