Hola! En NLnet Labs, hemos estado configurando Discourse para nuestros productos (community.nlnetlabs.nl). Un usuario preguntó sobre cómo obtener el feed RSS para un tema en particular (ej. https://community.nlnetlabs.nl/c/cascade/10), ya que su lector de RSS no podía encontrarlo.
Probé a usar esa página específica del tema con mi lector de feeds RSS preferido, y encontró dos feeds: “NLnet Labs Community - Latest Posts” (/posts.rss) y “NLnet Labs Community - Latest topics” (/latest.rss). Sé que /c/cascade/10.rss es un feed RSS válido, pero mi lector no pudo encontrarlo automáticamente. Esto es un poco frustrante, ya que tendremos que empezar a comunicar estas URL nosotros mismos.
He investigado el descubrimiento automático de feeds RSS para mi sitio web personal, así que tengo algo de experiencia con esto. Revisé el <head> de la página web; noté los siguientes enlaces:
<link rel="alternate" type="application/rss+xml" title="Latest posts" href="https://community.nlnetlabs.nl/posts.rss">
<link rel="alternate" type="application/rss+xml" title="Latest topics" href="https://community.nlnetlabs.nl/latest.rss">
<link rel="alternate nofollow" type="application/rss+xml" title="RSS feed of topics in the 'Cascade' category" href="https://community.nlnetlabs.nl/c/cascade/10.rss">
Así que el <head> sí incluye un tercer enlace para el feed RSS específico del tema; pero parece que a algunos lectores de feeds RSS no les gusta el atributo rel=”nofollow”.
Por supuesto, revisé MDN (HTML attribute: rel - HTML | MDN); nofollow está documentado como:
Indica que el autor o editor original del documento actual no respalda el documento referenciado.
Pero también:
Relevante para
<form>,<a>, y<area>, la palabra clavenofollowindica a las arañas de los motores de búsqueda que ignoren la relación del enlace. La relación nofollow puede indicar que el propietario del documento actual no respalda el documento referenciado. A menudo es incluida por los Optimistas de Motores de Búsqueda que simulan que sus granjas de enlaces no son páginas de spam.
Revisé el código fuente de Discourse en GitHub, y con algunas búsquedas y Git blame pude encontrar FEATURE: add nofollow to RSS alternate link in topics and categories by rr-it · Pull Request #16013 · discourse/discourse · GitHub. Así que supongo que el segundo significado de rel=”nofollow” fue el que se pretendía aquí. Siguiendo la discusión de fondo, parece ser útil para guiar la priorización en los rastreadores del sitio. Hubo un seguimiento adicional en Search engines now blocked from indexing non-canonical pages - #4 by rrit, pero no pude averiguar si rel=\"nofollow” sigue siendo importante.
No pude encontrar ninguna discusión en Discourse Meta sobre este problema, a pesar de que el PR fue fusionado en 2022. Claramente, hay un malentendido en las convenciones en torno a los <link>s para los feeds RSS, entre algunos lectores de feeds RSS y Discourse. Así que pregunto:
- ¿
rel=”nofollow”todavía cumple su intención original de mejorar la priorización de los rastreadores del sitio, o ha sido reemplazado por otras técnicas? - ¿Este comportamiento (es decir, ignorar los enlaces
rel=”nofollow”) en el autodescubrimiento de lectores de feeds RSS parece ser común? ¿Pueden otros replicarlo? No estoy al tanto de un estándar autoritario sobre el autodescubrimiento de feeds RSS. - ¿Hay voluntad para soportar este caso de uso, para que los lectores de feeds RSS descubran automáticamente las publicaciones correctas? La existencia de esos
<link>s específicos del tema, incluso si mi lector no los está utilizando, me hace pensar que sí; tal vez la pérdida de funcionalidad fue simplemente pasada por alto cuando se agregórel=”nofollow”.
A los desarrolladores de Discourse: ¡gracias por construir esto!