Envía un encabezado de enlace canonical en lugar de un encabezado noindex.
Enviar un encabezado canonical probablemente tiene la misma ventaja en el presupuesto de rastreo que enviar un encabezado noindex, sin las implicaciones de SEO de excluir URL que podrían tener backlinks a través de noindex.
Si puedes configurar tu servidor, puedes usar un encabezado HTTP rel="canonical" (en lugar de una etiqueta HTML) para indicar la URL canónica de un documento admitido por la Búsqueda, incluidos documentos no HTML como archivos PDF.
Podemos configurar nuestro servidor.
¿usar un encabezado HTTP rel="canonical" en lugar de una etiqueta HTML enfatiza una preferencia por la solución del encabezado HTTP?
Googlebot maneja los encabezados no-index de manera muy elegante. Aconseja dejar tantas rutas como sea posible abiertas y utiliza encabezados para reglas de alta fidelidad con respecto a los índices.
Quizás Google maneja los encabezados de enlace canonical con la misma elegancia que los encabezados no-index.
Me está costando esto, al leer la recomendación de Google parece que no le importa particularmente.
Las recomendaciones para la cabecera HTTP rel="canonical" son las mismas que la etiqueta linkrel="canonical".
Supongo que no hay mucho que perder y es posible que una combinación de no indexar más rel canonical sea la receta correcta de Google. Pero no estoy seguro.
Esto revierte la configuración del sitio introducida recientemente a lo que es básicamente una no-operación (moviendo lo que enviamos como una etiqueta de encabezado en un encabezado, sin cambios semánticos).
Para la nueva configuración predeterminada SiteSetting.allow_indexing_non_canonical_urls = false, esta es la forma en que está implementada ahora mismo y se mantiene así:
encabezado noindex
etiqueta de enlace html canonical (podría ser ignorada)
Sin parche y SiteSetting.allow_indexing_non_canonical_urls = true
– sin encabezado –
etiqueta de enlace html canonical
Con parche y SiteSetting.allow_indexing_non_canonical_urls = true
etiqueta de enlace html canonical (podría ser ignorada, pero de todos modos es igual que el encabezado)
Toda la idea detrás de esto:
Establecer canonical como encabezado http para obtener el mismo beneficio que el encabezado httpnoindex, es decir, una indexación más rápida.
Por lo tanto, esto podría hacer que noindex sea obsoleto con sus implicaciones inciertas.
Otro punto sobre noindex vs. canonical:
noindex es más que una señal muy fuerte para no incluir la página en el índice de búsqueda.
Pero con noindex, el contenido de la página todavía es procesado por Google Bot para extraer enlaces (existe la opción adicional nofollow para deshabilitar esto).
canonical es una señal fuerte de que el contenido a rastrear está en alguna otra URL canónica.
En caso de que Google Bot decida aceptar esta señal para una página, existe una gran posibilidad de que no procese el contenido de la página en absoluto, y solo procese la URL canónica.
Este es un ‘experimento mental’. No está implementado en ninguna parte y nunca recomiendo implementarlo:
encabezado noindex
metaetiqueta html noindex (en lugar de: etiqueta de enlace html canonical)
– O –
– sin encabezado –
metaetiqueta html noindex
¿Por qué implementarlo o no implementarlo de esta manera?
Este cambio no es una ‘operación nula’:
Google puede manejar encabezados y contenido HTML en diferentes etapas de sus colas de procesamiento. Al enviar encabezados, podríamos omitir colas de procesamiento adicionales (por ejemplo, la Cola de Renderizado) y, por lo tanto, liberar presupuesto de rastreo para páginas más importantes.
No estoy fuertemente en contra de esto, pero parece muy menor. Google siempre está descargando contenido hoy en día, dudo que guardar un análisis HTML realmente marque una diferencia material.
Hay muchas otras áreas en las que centrarse primero, los microdatos son probablemente el primer lugar que necesita atención.