Envie um cabeçalho de link canonical em vez de um cabeçalho noindex.
Enviar um cabeçalho canonical provavelmente tem a mesma vantagem no orçamento de rastreamento que enviar um cabeçalho noindex - sem as implicações de SEO de excluir URLs que podem ter backlinks via noindex.
Se você puder configurar seu servidor, poderá usar um cabeçalho HTTPrel="canonical" (em vez de uma tag HTML) para indicar o URL canônico de um documento suportado pela Pesquisa, incluindo documentos não HTML, como arquivos PDF.
Podemos configurar nosso servidor.
usar um cabeçalho HTTP rel="canonical" em vez de uma tag HTML enfatiza uma preferência pela solução de cabeçalho HTTP?
O Googlebot lida com cabeçalhos no-index de forma muito elegante. Ele aconselha a deixar o maior número possível de rotas abertas e usa cabeçalhos para regras de alta fidelidade em relação aos índices.
Talvez o Google lide com cabeçalhos de link canonical de forma tão elegante quanto os cabeçalhos no-index.
Estou com dificuldades com isso, lendo a recomendação do Google, parece que ele não se importa particularmente.
As recomendações para o cabeçalho HTTP rel="canonical" são as mesmas da tag linkrel="canonical".
Acho que não há muito a perder e é possível que uma combinação de “no index” mais “rel canonical” seja a receita certa do Google. Mas não tenho certeza.
Isso está revertendo a configuração de site introduzida recentemente para o que é basicamente um noop (movendo o que enviamos como uma tag de cabeçalho em um cabeçalho, sem alteração semântica).
Para a nova configuração padrão SiteSetting.allow_indexing_non_canonical_urls = false, esta é a forma como está implementada no momento - e permanece assim:
cabeçalho noindex
tag de link html canonical (pode ser ignorada)
Sem patch e com SiteSetting.allow_indexing_non_canonical_urls = true
– sem cabeçalho –
tag de link html canonical
Com patch e SiteSetting.allow_indexing_non_canonical_urls = true
tag de link html canonical (pode ser ignorada - mas de qualquer forma igual ao cabeçalho)
Toda a ideia por trás disso:
Definir canonical como cabeçalho http para obter o mesmo benefício que o cabeçalho httpnoindex - ou seja, rastreamento mais rápido.
Com isso, noindex pode se tornar obsoleto com suas implicações incertas.
Outro ponto sobre noindex vs. canonical:
noindex é mais do que um sinal muito forte para não colocar a página no índice de pesquisa.
Mas com noindex, o conteúdo da página ainda é processado pelo Google Bot para extrair links (há a opção extra nofollow para desativar isso).
canonical é um sinal forte de que o conteúdo a ser rastreado está em alguma outra URL canônica.
Em caso de o Google Bot decidir aceitar este sinal para uma página, há uma grande chance de ele não processar o conteúdo da página de forma alguma – e processar apenas a URL canônica.
Este é um ‘experimento mental’. Não está implementado em lugar nenhum - e eu nunca recomendo implementá-lo:
cabeçalho noindex
meta-tag html noindex (em vez de: tag de link html canonical)
– OU –
– sem cabeçalho –
meta-tag html noindex
Por que implementar ou não implementar dessa forma?
Essa alteração não é um ‘noop’:
O Google pode lidar com cabeçalhos e conteúdo HTML em diferentes estágios de suas filas de processamento. Ao enviar cabeçalhos, podemos pular filas de processamento adicionais (por exemplo, Fila de Renderização) e, assim, liberar o orçamento de rastreamento para páginas mais importantes.
Não sou fortemente contra isso, mas parece tão insignificante. O Google está sempre baixando conteúdo hoje em dia, duvido que salvar um parse de HTML realmente faça alguma diferença material.
Muitas outras áreas precisam de foco primeiro, os microdados são provavelmente o primeiro lugar que precisa de atenção.