Este es un error de contenido duplicado y debería considerarse un problema urgente de SEO para la plataforma Discourse (actualmente estoy ejecutando v2.4.0.beta3 +4).
Intenté entender por qué ocurre esto y me sorprendió descubrir que, al inspeccionar el código fuente de la página, el enlace canónico se actualiza a medida que avanzo hacia abajo en la página:
Así que, supongo que la lógica aquí es que los hilos largos se paginan, pero dado que esto es una SPA con carga diferida, los enlaces canónicos se comportan como si se tratara de una paginación tradicional. La verdad es que no estoy seguro de cuál sea la razón para hacerlo de esta manera.
Por cierto, las mejores prácticas de SEO para la paginación son NO proporcionar una meta descripción y un título idénticos en la página 2, etc. Aquí tienes un ejemplo de cómo implementé la paginación en otra parte de mi sitio web:
¿Cuál es la razón de SEO para proporcionar enlaces canónicos que apunten a puntos paginados dentro del hilo?
Si este enfoque está justificado de alguna manera, ¿podemos al menos asegurarnos de que el título y los metadatos no generen resultados duplicados en los resultados de búsqueda de Google (SERPs)?
Para los rastreadores, Discourse utiliza páginas de 20 publicaciones, por lo que cada publicación puede ser rastreada sin problemas. No hay SPA para los bots.
Tiene más de 800 publicaciones, así que eso es lo esperado.
¿Por qué? ¿Cuál es el problema real? Si realizas una búsqueda real en el mundo de una palabra, ¿estamos enlazando a una página que no contiene la palabra o algo así?
Lo siento, SPA puede ser el término incorrecto; solo quería decir que un hilo de Discourse se comporta de cierta manera como una aplicación de una sola página en el sentido de que la paginación ocurre dinámicamente…
Sí, supongo que tiene sentido. Intenté buscar algún texto en la página 3; Google me llevó a la página 3, así que eso parece bueno. El lugar incorrecto dentro de la página, pero parece lo más cercano que podemos lograr en esta situación.
Así que, en retrospectiva, supongo que tener los canónicos de paginación tiene sentido en hilos más largos, pero si observas las mejores prácticas para SEO, la recomendación es no permitir que Google indexe contenido paginado con título y metadescripción idénticos. Supongo que la solución aquí es cambiar el título y los metadatos en las páginas sucesivas. Ver:
¿En qué sería eso mejor para los visitantes humanos del foro? ¿No crees que algunos podrían confundirse si piensan que van a, por ejemplo, “página 2” y terminan en un área de “la única página”? ¿No buscarían en vano una navegación de paginación que no existe?
Preferiría tener más visitantes confundidos que menos tráfico de Google. El contenido duplicado es un verdadero problema de SEO, y los “me gusta” en tu comentario por parte de dos miembros del equipo de Discourse son realmente desconcertantes.
No estoy seguro de que lo consideraría lo suficientemente grave como para llamarlo “un verdadero problema de SEO”. Por lo que sé, lo que ocurre sin rel="canonical" es que los motores de búsqueda deciden qué URL de resultado se ajusta mejor a la búsqueda en lugar de lo que un sitio podría preferir como URL de resultado (la canónica).
Creo que puede que hayas pasado por alto la imagen que publiqué arriba… Aquí está el texto:
John Mueller comentó: «No tratamos la paginación de manera diferente. Las tratamos como páginas normales».
Esto significa que las páginas paginadas ya no son reconocidas por Google como una serie de páginas consolidadas en un único contenido, como se aconsejaba anteriormente. Cada página paginada puede competir con la página raíz para obtener un buen posicionamiento.
Para incentivar a Google a mostrar la página raíz en los resultados de búsqueda (SERP) y evitar advertencias de «Descripciones meta duplicadas» o «Etiquetas de título duplicadas» en Google Search Console, realiza una modificación sencilla en tu código.
Si la página raíz tiene la fórmula:
Las páginas paginadas sucesivas podrían tener la fórmula:
Estos títulos de página y descripciones meta de las URL paginadas son intencionalmente subóptimos para disuadir a Google de mostrar estos resultados en lugar de la página raíz.
Si, incluso con estas modificaciones, las páginas paginadas aparecen en los SERP, prueba otras tácticas tradicionales de SEO on-page, como:
Desoptimizar las etiquetas H1 de las páginas paginadas.
Agregar texto útil en la página on-page a la página raíz, pero no a las páginas paginadas.
Agregar una imagen de categoría con un nombre de archivo optimizado y una etiqueta alt a la página raíz, pero no a las páginas paginadas.
Ah, gracias. Me perdí que la preocupación no se refiere al contenido duplicado, sino a las advertencias sobre títulos y descripciones meta duplicados.
Al menos en Discourse, esas son más bien “notificaciones” que advertencias. Algo así como: “si no lo sabías, deberías verificar que esté bien y, si no, solucionarlo”. Puedes ignorarlas con seguridad, ya que una discusión en un tema no debería desviarse tanto como para que lo apropiado para los primeros mensajes no se aplique a todos los mensajes posteriores del tema.
Por ejemplo, si los mensajes de la “página 1” tratan sobre “widgets rojos redondos” y en la “página 2” los mensajes hablan de “engranajes verdes cuadrados”, se debe instar a los miembros a mantenerse en el tema o bien dividir la discusión en temas separados.