Enviar encabezado de enlace canónico en lugar de encabezado noindex

Envía un encabezado de enlace canonical en lugar de un encabezado noindex.

Enviar un encabezado canonical probablemente tiene la misma ventaja en el presupuesto de rastreo que enviar un encabezado noindex, sin las implicaciones de SEO de excluir URL que podrían tener backlinks a través de noindex.


Consulta también How to Specify a Canonical with rel="canonical" and Other Methods | Google Search Central  |  Documentation  |  Google for Developers

Si puedes configurar tu servidor, puedes usar un encabezado HTTP rel="canonical" (en lugar de una etiqueta HTML) para indicar la URL canónica de un documento admitido por la Búsqueda, incluidos documentos no HTML como archivos PDF.

  • :+1: Podemos configurar nuestro servidor.
  • ¿usar un encabezado HTTP rel="canonical" en lugar de una etiqueta HTML enfatiza una preferencia por la solución del encabezado HTTP?

De #11553

Googlebot maneja los encabezados no-index de manera muy elegante. Aconseja dejar tantas rutas como sea posible abiertas y utiliza encabezados para reglas de alta fidelidad con respecto a los índices.

Quizás Google maneja los encabezados de enlace canonical con la misma elegancia que los encabezados no-index.

1 me gusta

Me está costando esto, al leer la recomendación de Google parece que no le importa particularmente.

Las recomendaciones para la cabecera HTTP rel="canonical" son las mismas que la etiqueta link rel="canonical".

Supongo que no hay mucho que perder y es posible que una combinación de no indexar más rel canonical sea la receta correcta de Google. Pero no estoy seguro.

¿@Falco?

Esto revierte la configuración del sitio introducida recientemente a lo que es básicamente una no-operación (moviendo lo que enviamos como una etiqueta de encabezado en un encabezado, sin cambios semánticos).

No quiero este cambio tal como está.

1 me gusta

Para la nueva configuración predeterminada SiteSetting.allow_indexing_non_canonical_urls = false, esta es la forma en que está implementada ahora mismo y se mantiene así:

  • encabezado noindex
  • etiqueta de enlace html canonical (podría ser ignorada)

Sin parche y SiteSetting.allow_indexing_non_canonical_urls = true

  • – sin encabezado –
  • etiqueta de enlace html canonical

Con parche y SiteSetting.allow_indexing_non_canonical_urls = true

  • encabezado: Link: <https://forum.example.com/t/test-example/1234>; rel="canonical"
  • etiqueta de enlace html canonical (podría ser ignorada, pero de todos modos es igual que el encabezado)

Toda la idea detrás de esto:
Establecer canonical como encabezado http para obtener el mismo beneficio que el encabezado http noindex, es decir, una indexación más rápida.
Por lo tanto, esto podría hacer que noindex sea obsoleto con sus implicaciones inciertas.

Otro punto sobre noindex vs. canonical:

  • noindex es más que una señal muy fuerte para no incluir la página en el índice de búsqueda.
    Pero con noindex, el contenido de la página todavía es procesado por Google Bot para extraer enlaces (existe la opción adicional nofollow para deshabilitar esto).
  • canonical es una señal fuerte de que el contenido a rastrear está en alguna otra URL canónica.
    En caso de que Google Bot decida aceptar esta señal para una página, existe una gran posibilidad de que no procese el contenido de la página en absoluto, y solo procese la URL canónica.

Este es un ‘experimento mental’. No está implementado en ninguna parte y nunca recomiendo implementarlo:

  • encabezado noindex
  • metaetiqueta html noindex (en lugar de: etiqueta de enlace html canonical)

– O –

  • – sin encabezado –
  • metaetiqueta html noindex

¿Por qué implementarlo o no implementarlo de esta manera?

Este cambio no es una ‘operación nula’:
Google puede manejar encabezados y contenido HTML en diferentes etapas de sus colas de procesamiento. Al enviar encabezados, podríamos omitir colas de procesamiento adicionales (por ejemplo, la Cola de Renderizado) y, por lo tanto, liberar presupuesto de rastreo para páginas más importantes.

Ver In-Depth Guide to How Google Search Works | Google Search Central  |  Documentation  |  Google for Developers

(El único gráfico de la cola de procesamiento que he encontrado: Understand JavaScript SEO Basics | Google Search Central  |  Documentation  |  Google for Developers)

El cambio de noindex se ha revertido recientemente:

¿Podrías echar un nuevo vistazo a esta PR?:

No estoy fuertemente en contra de esto, pero parece muy menor. Google siempre está descargando contenido hoy en día, dudo que guardar un análisis HTML realmente marque una diferencia material.

Hay muchas otras áreas en las que centrarse primero, los microdatos son probablemente el primer lugar que necesita atención.