Enviar encabezado de enlace canónico en lugar de encabezado noindex

rrit · 6 Marzo, 2022 17:07

Envía un encabezado de enlace canonical en lugar de un encabezado noindex.

Enviar un encabezado canonical probablemente tiene la misma ventaja en el presupuesto de rastreo que enviar un encabezado noindex, sin las implicaciones de SEO de excluir URL que podrían tener backlinks a través de noindex.

Consulta también How to Specify a Canonical with rel="canonical" and Other Methods | Google Search Central | Documentation | Google for Developers

Si puedes configurar tu servidor, puedes usar un encabezado HTTP rel="canonical" (en lugar de una etiqueta HTML) para indicar la URL canónica de un documento admitido por la Búsqueda, incluidos documentos no HTML como archivos PDF.

Podemos configurar nuestro servidor.
¿usar un encabezado HTTP rel="canonical" en lugar de una etiqueta HTML enfatiza una preferencia por la solución del encabezado HTTP?

De #11553

Googlebot maneja los encabezados no-index de manera muy elegante. Aconseja dejar tantas rutas como sea posible abiertas y utiliza encabezados para reglas de alta fidelidad con respecto a los índices.

Quizás Google maneja los encabezados de enlace canonical con la misma elegancia que los encabezados no-index.

sam · 8 Marzo, 2022 03:36

Me está costando esto, al leer la recomendación de Google parece que no le importa particularmente.

Las recomendaciones para la cabecera HTTP rel="canonical" son las mismas que la etiqueta link rel="canonical".

Supongo que no hay mucho que perder y es posible que una combinación de no indexar más rel canonical sea la receta correcta de Google. Pero no estoy seguro.

¿@Falco?

Falco · 8 Marzo, 2022 03:48

Esto revierte la configuración del sitio introducida recientemente a lo que es básicamente una no-operación (moviendo lo que enviamos como una etiqueta de encabezado en un encabezado, sin cambios semánticos).

No quiero este cambio tal como está.

rrit · 8 Marzo, 2022 08:40

Para la nueva configuración predeterminada SiteSetting.allow_indexing_non_canonical_urls = false, esta es la forma en que está implementada ahora mismo y se mantiene así:

encabezado noindex
etiqueta de enlace html canonical (podría ser ignorada)

Sin parche y SiteSetting.allow_indexing_non_canonical_urls = true

– sin encabezado –
etiqueta de enlace html canonical

Con parche y SiteSetting.allow_indexing_non_canonical_urls = true

encabezado: Link: <https://forum.example.com/t/test-example/1234>; rel="canonical"
etiqueta de enlace html canonical (podría ser ignorada, pero de todos modos es igual que el encabezado)

Toda la idea detrás de esto:
Establecer canonical como encabezado http para obtener el mismo beneficio que el encabezado http noindex, es decir, una indexación más rápida.
Por lo tanto, esto podría hacer que noindex sea obsoleto con sus implicaciones inciertas.

Otro punto sobre noindex vs. canonical:

noindex es más que una señal muy fuerte para no incluir la página en el índice de búsqueda.
Pero con noindex, el contenido de la página todavía es procesado por Google Bot para extraer enlaces (existe la opción adicional nofollow para deshabilitar esto).
canonical es una señal fuerte de que el contenido a rastrear está en alguna otra URL canónica.
En caso de que Google Bot decida aceptar esta señal para una página, existe una gran posibilidad de que no procese el contenido de la página en absoluto, y solo procese la URL canónica.

Este es un ‘experimento mental’. No está implementado en ninguna parte y nunca recomiendo implementarlo:

encabezado noindex
metaetiqueta html noindex (en lugar de: etiqueta de enlace html canonical)

– O –

– sin encabezado –
metaetiqueta html noindex

¿Por qué implementarlo o no implementarlo de esta manera?

rrit · 8 Marzo, 2022 09:26

Este cambio no es una ‘operación nula’:
Google puede manejar encabezados y contenido HTML en diferentes etapas de sus colas de procesamiento. Al enviar encabezados, podríamos omitir colas de procesamiento adicionales (por ejemplo, la Cola de Renderizado) y, por lo tanto, liberar presupuesto de rastreo para páginas más importantes.

Ver In-Depth Guide to How Google Search Works | Google Search Central | Documentation | Google for Developers

(El único gráfico de la cola de procesamiento que he encontrado: Understand JavaScript SEO Basics | Google Search Central | Documentation | Google for Developers)

rrit · 20 Marzo, 2022 14:10

El cambio de noindex se ha revertido recientemente:

Search engines now blocked from indexing non-canonical pages - #30 by sam
FEATURE: enable canonical url indexing by SamSaffron · Pull Request #16196 · discourse/discourse · GitHub

¿Podrías echar un nuevo vistazo a esta PR?:

sam · 21 Marzo, 2022 00:14

No estoy fuertemente en contra de esto, pero parece muy menor. Google siempre está descargando contenido hoy en día, dudo que guardar un análisis HTML realmente marque una diferencia material.

Hay muchas otras áreas en las que centrarse primero, los microdatos son probablemente el primer lugar que necesita atención.

Tema		Respuestas	Vistas
Search engines now blocked from indexing non-canonical pages Announcements seo	23	4569	15 Marzo 2022
3 Pages Indexed in Google with same canonical tag Feature	1	545	8 Noviembre 2020
Homepage doesn't have canonical URL Feature	9	1985	4 Enero 2020
Canonical Meta Data Does Not Change Correctly in Discourse App when not loaded by a webcrawler Feature	5	974	1 Agosto 2020
I want to Update rel=canonical href using Java Script Support	18	4366	2 Agosto 2020

Enviar encabezado de enlace canónico en lugar de encabezado noindex

Temas relacionados