Este é um bug de conteúdo duplicado e deve ser considerado um problema urgente de SEO para a plataforma Discourse (atualmente estou executando a versão v2.4.0.beta3 +4).
Tentei entender por que isso está acontecendo e fiquei surpreso ao descobrir que, ao inspecionar o código-fonte da página, o link canônico é atualizado conforme eu rolo para baixo na página:
Então, suponho que a lógica aqui seja que threads longas sejam paginadas, mas como se trata de uma SPA com carregamento preguiçoso, os canônicos estão se comportando como se a paginação tradicional estivesse ocorrendo. Honestamente, não tenho certeza qual é a razão para fazer isso dessa maneira.
A propósito, as melhores práticas de SEO para paginação são NÃO fornecer meta descrições e títulos idênticos na página 2, etc. Aqui está um exemplo de como implementei a paginação em outra parte do meu site:
Qual é a razão de SEO para fornecer canônicos apontando para pontos paginados na thread?
Se essa abordagem for de alguma forma justificada, podemos pelo menos garantir que o título e os metadados não resultem em resultados duplicados nos resultados do Google Serps?
Para os rastreadores, o Discourse usa páginas de 20 posts, de modo que cada post individual pode ser rastreado perfeitamente. Não há SPA para bots.
Ele tem mais de 800 posts, então isso é esperado.
Por quê? Qual é o problema real? Se você fizer uma busca no mundo real por uma palavra, estamos linkando para uma página que não contém a palavra ou algo assim?
Desculpe, SPA pode ser o termo errado; eu apenas quis dizer que um tópico do Discourse se comporta de certa forma como um aplicativo de página única, no sentido de que a paginação ocorre dinamicamente…
Sim, acho que faz sentido. Tentei pesquisar algum texto na página 3, o Google me levou para a página 3, então parece bom. Lugar errado na página, mas parece ser o mais próximo que podemos chegar nesta situação.
Então, em retrospecto, acho que ter os canônicos de paginação faz sentido em tópicos mais longos, mas se você olhar as melhores práticas para SEO, a orientação é não permitir que o Google indexe conteúdo paginado com título e meta descrição idênticos. Acho que a solução aqui é alterar o título e a meta nas páginas sucessivas. Veja:
Como isso seria melhor para os visitantes humanos do fórum? Você não acha que alguns podem ficar confusos se acharem que estão indo, por exemplo, para a “página 2” e acabarem em uma área de “a única página”? Eles podem procurar em vão por uma navegação de paginação que não existe?
Prefiro ter mais visitantes confusos do que menos tráfego do Google. Conteúdo duplicado é um problema real de SEO, e os ‘curtidas’ no seu comentário por dois membros da equipe do Discourse são seriamente perplexantes.
Não tenho certeza se consideraria isso sério o suficiente para chamá-lo de “um problema real de SEO”. Pelo que sei, o que acontece sem rel="canonical" é que os mecanismos de busca decidem qual URL de resultado melhor corresponde à pesquisa, em vez do que um site pode preferir como URL de resultado (o canônico).
Acho que você pode ter pulado a imagem que postei acima… Aqui está o texto:
John Mueller comentou: “Não tratamos a paginação de forma diferente. Tratamos as páginas paginadas como páginas normais.”
Isso significa que as páginas paginadas não são reconhecidas pelo Google como uma série de páginas consolidadas em um único conteúdo, como era recomendado anteriormente. Cada página paginada pode competir com a página raiz pelo ranking.
Para incentivar o Google a exibir a página raiz nos resultados de pesquisa (SERPs) e evitar alertas de “Descrições meta duplicadas” ou “Tags de título duplicadas” no Google Search Console, faça uma modificação simples no seu código.
Se a página raiz tiver a fórmula:
As páginas paginadas subsequentes podem ter a fórmula:
Esses títulos de página e descrições meta das URLs paginadas são propositalmente subótimos para desencorajar o Google a exibir esses resultados em vez da página raiz.
Se, mesmo com essas modificações, as páginas paginadas continuarem aparecendo nos resultados de pesquisa (SERPs), tente outras táticas tradicionais de SEO on-page, como:
Desotimizar as tags H1 das páginas paginadas.
Adicionar texto útil na página raiz, mas não nas páginas paginadas.
Adicionar uma imagem de categoria com nome de arquivo e tag alt otimizados na página raiz, mas não nas páginas paginadas.
Ah, obrigado. Percebi que a preocupação não é sobre conteúdo duplicado, mas sim sobre avisos de título e meta-descrição duplicados.
Pelo menos no Discourse, esses são mais como “notícias” do que avisos. É como dizer: “se você não sabia disso, verifique para garantir que está tudo bem e, se não estiver, corrija”. Você pode ignorá-los com segurança, pois uma discussão de tópico não deve se desviar tanto a ponto de o que seria apropriado para as primeiras postagens não se aplicar a todas as postagens subsequentes no tópico.
Por exemplo, se as postagens da “página 1” são sobre “peças vermelhas redondas” e, na “página 2”, as postagens são sobre “engrenagens verdes quadradas”, os membros devem ser incentivados a permanecer no tópico ou a discussão deve ser dividida em tópicos separados.