Bonjour ! Chez NLnet Labs, nous avons configuré Discourse pour nos produits (community.nlnetlabs.nl). Un utilisateur a posé une question sur l’obtention du flux RSS pour un sujet particulier (par exemple, Cascade - NLnet Labs Community), car son lecteur RSS ne parvenait pas à le trouver.
J’ai essayé d’utiliser cette page spécifique au sujet avec mon lecteur de flux RSS préféré, et il a trouvé deux flux : « NLnet Labs Community - Latest Posts » (/posts.rss) et « NLnet Labs Community - Latest topics » (/latest.rss). Je sais que /c/cascade/10.rss est un flux RSS valide, mais mon lecteur n’a pas pu le trouver automatiquement. C’est un peu frustrant, car nous devrons commencer à communiquer ces URL nous-mêmes.
J’ai étudié la découverte automatique de flux RSS pour mon site personnel, j’ai donc une certaine expérience à ce sujet. J’ai vérifié le <head> de la page web ; j’ai remarqué les liens suivants :
<link rel="alternate" type="application/rss+xml" title="Latest posts" href="https://community.nlnetlabs.nl/posts.rss">
<link rel="alternate" type="application/rss+xml" title="Latest topics" href="https://community.nlnetlabs.nl/latest.rss">
<link rel="alternate nofollow" type="application/rss+xml" title="RSS feed of topics in the 'Cascade' category" href="https://community.nlnetlabs.nl/c/cascade/10.rss">
Ainsi, le <head> inclut bien un troisième lien pour le flux RSS spécifique au sujet ; mais il semble que certains lecteurs de flux RSS n’aiment pas l’attribut rel=”nofollow”.
Bien sûr, j’ai vérifié MDN ( HTML attribute: rel - HTML | MDN ) ; nofollow est documenté comme suit :
Indique que l’auteur ou l’éditeur original du document actuel n’approuve pas le document référencé.
Mais aussi :
Pertinent pour
<form>,<a>, et<area>, le mot-clénofollowindique aux robots d’exploration des moteurs de recherche d’ignorer la relation de lien. La relation nofollow peut indiquer que le propriétaire du document actuel n’approuve pas le document référencé. Elle est souvent incluse par les référenceurs qui prétendent que leurs fermes de liens ne sont pas des pages de spam.
J’ai parcouru le code source de Discourse sur GitHub, et après quelques recherches et git blame, j’ai pu trouver FEATURE: add nofollow to RSS alternate link in topics and categories by rr-it · Pull Request #16013 · discourse/discourse · GitHub. Je suppose donc que la deuxième signification de rel=”nofollow” était l’intention ici. En suivant la discussion de fond, il semble que cela soit utile pour guider la priorisation dans les robots d’exploration du site. Il y a eu un suivi supplémentaire dans Search engines now blocked from indexing non-canonical pages - #4 by rrit, mais je n’ai pas pu déterminer si rel=\"nofollow” est toujours important.
Je n’ai trouvé aucune discussion sur Discourse Meta concernant ce problème, même si la PR a été fusionnée en 2022. Clairement, il y a un malentendu dans les conventions concernant les <link> pour les flux RSS, entre certains lecteurs de flux RSS et Discourse. Je demande donc :
rel=”nofollow”sert-il toujours son intention originale d’améliorer la priorisation des robots d’exploration du site, ou a-t-il été remplacé par d’autres techniques ?- Ce comportement (c’est-à-dire ignorer les liens
rel=”nofollow”) dans la découverte automatique des lecteurs de flux RSS semble-t-il courant ? D’autres peuvent-ils le reproduire ? Je ne connais pas de norme faisant autorité sur la découverte automatique des flux RSS. - Y a-t-il une volonté de prendre en charge ce cas d’utilisation, pour que les lecteurs de flux RSS puissent découvrir automatiquement les bons messages ? L’existence de ces
<link>spécifiques aux sujets, même s’ils ne sont pas utilisés par mon lecteur, me fait penser que oui ; peut-être que la perte de fonctionnalité a été simplement négligée lorsquerel=”nofollow”a été ajouté.
Aux développeurs de Discourse : merci pour la création de cet outil !