Usamos el plugin RSS (o copias manuales) para nuestras publicaciones de blog para crearlas como un ancla de discusión en una categoría. A Google no le gusta este contenido “copiado” y amenaza con dañar la reputación SEO del blog.
Por supuesto, podemos detener la indexación de Google de la discusión (o la categoría), pero ¿alguien tiene experiencia en definir de alguna manera que esto es intencional? ¿Algo como “este subdominio pertenece al blog, no intentamos crear granjas de enlaces” o algo así? Si es así, ¿cómo implementarlo en la configuración de Discourse?
Creo recordar aproximadamente que con rel=nofollow o similar, al menos se abordaría el aspecto de la granja de enlaces (no estoy seguro sobre el aspecto del contenido duplicado). ¿Hay quizás una cabecera “esto es una copia de” que apacigüe a Google?
La razón por la que enlacé a la documentación es porque no estoy seguro sobre el caso de habilitar la configuración embed set canonical url cuando la configuración embed truncate está habilitada. Cuando embed truncate está habilitada, solo un fragmento del artículo original está realmente disponible para que Google lo rastree en Discourse. El artículo completo se muestra en un iframe si los usuarios hacen clic en el botón “Mostrar publicación completa”. Estoy bastante seguro de que Google no rastrea el contenido del iframe. El primer punto del artículo “5 errores comunes” aborda ese problema.
¡Gracias por la pista, Simon! De hecho, canónica parece ser lo que estaba pensando. Lo intenté, pero no funciona por completo, incrusta una URL canónica que apunta a sí misma, no a la fuente RSS:
Intenta ver el código fuente de la página, en lugar de verlo con el inspector web de tu navegador. Creo que verás que la URL canónica se establece en la URL de la publicación RSS cuando ves el código fuente de la página, y se establece en la URL del tema de Discourse cuando ves el HTML con el inspector web. Si eso es correcto, no deberías recibir advertencias de contenido duplicado para los temas RSS.
Aquí está lo que estoy viendo (con embed set canonical url habilitado) cuando veo un tema extraído del feed RSS de Discourse en mi inspector web:
Y aquí está la URL canónica cuando veo el código fuente de la página (haciendo clic derecho en la página y seleccionando “Ver código fuente de la página” en el menú):
Creo que la configuración está funcionando como se esperaba en términos de lo que ven los rastreadores, pero me estaba confundiendo. El problema parece ser que Discourse sobrescribe el atributo de URL canónica con Javascript cuando la página se ve con Javascript habilitado. Como referencia, eso sucede aquí:
No creo que sea (actualmente) posible tener el enlace destacado configurado para los temas creados a partir de feeds RSS. No soy un experto en SEO, pero no creo que configurarlo o no configurarlo tenga ningún efecto en el SEO.
Usé curl -i | grep canon y vi una URL de etiqueta incorrecta (y sin encabezado), pero puedo intentarlo de nuevo con una UA diferente (lo cual es un poco extraño) - tuve que recrear las publicaciones varias veces, así que tal vez estaba confundido. Actualizaré aquí.
Cierto, el enlace destacado no es para SEO, pero internamente tenía el deseo de hacer más visible el enlace del blog. Y como es la misma URL…
(Pero parece que obtengo una lista más larga de requisitos, así que podría necesitar bifurcar el rss-poll (desafortunadamente, parece que la mayor parte del trabajo no se realiza en el complemento, sin embargo). ¿El código de inserción también es extensible?
Para un tema creado a partir de un feed RSS, con embed set canonical url habilitado, esperaría que curl -i devolviera la URL del elemento RSS como la URL canónica. Eso funciona cuando lo pruebo en mi sitio local.
Suponiendo que tiene acceso a la consola de Discourse Rails, puede confirmar lo que está sucediendo encontrando el tema y luego verificando su propiedad topic_embed. Por ejemplo:
t = Topic.find 495
t.topic_embed
o simplemente:
TopicEmbed.find_by(topic_id: 495)
Se debería devolver un TopicEmbed. Su embed_url es lo que se espera que Discourse utilice para establecer la URL canónica del tema.
Yo también me he preguntado eso. Sería más difícil que hacer cambios en el plugin RSS, porque la incrustación es parte del código central de Discourse.