Visão geral de SEO do Discourse (sitemap / robots.txt)

O Discourse possui muitos recursos de SEO que funcionam imediatamente. Usando nossas configurações padrão sensatas, os gerentes de comunidade podem se concentrar em cultivar uma comunidade e não devem se sentir tão distraídos pela otimização para mecanismos de busca. Dito isso, há algumas coisas que você pode mudar, algumas coisas que você deve saber e algumas dicas e truques gerais abaixo.

Aqui está uma comparação do que um usuário vê e o que um mecanismo de busca vê:

Lista de Tópicos:

Tópico:

Meta Tags

No Discourse, as meta tags genéricas essenciais para SEO são geradas automaticamente com base no conteúdo presente na página. A tag de título, por exemplo, é derivada do título do site ou do tópico, e a descrição é gerada a partir do conteúdo da primeira postagem. No entanto, a personalização por página para metadados é limitada. Para alterar esses valores, você precisa ajustar as configurações ou os campos de conteúdo de onde eles são gerados.

  • As configurações do site Título, Descrição e Breve descrição do site
  • Os nomes das categorias
  • Os títulos e o conteúdo das postagens
  • E assim por diante :technologist:

Estrutura de URL e Codificação

Caracteres não latinos e URLs

O Discourse, por padrão, remove caracteres não latinos das URLs de tópicos quando o idioma é definido como EN. Para evitar isso, você pode alterar o idioma para o idioma não latino principal ou alterar a configuração método de geração de slug de ASCII para codificado.

Configuração de Subpasta vs. Subdomínio

O Discourse tende a preferir subdomínios em vez de subpastas devido à sua simplicidade técnica. O Google realmente não tem preferência entre os dois[1], mas o Discourse recomenda fortemente evitar configurações de subpasta, a menos que você tenha um profundo conhecimento técnico.

Canonicalização

O Google está interessado em indexar versões canônicas das páginas. No Discourse, para um tópico com várias respostas, o link canônico (a primeira postagem) é entregue ao Google, que então decide sobre a indexação. Tópicos com mais de 20 postagens serão paginados, cada página sendo um link canônico contendo até 20 postagens.
Por exemplo, a tag canônica para a última resposta neste tópico tópico será https://meta.discourse.org/t/try-out-the-new-sidebar-and-notification-menus/238821?page=12.

Schema Markup

Usamos marcação schema.org para ajudar na categorização de conteúdo em mecanismos de busca através de breadcrumbs. O nome da categoria em um slug de tópico é incluído:

Sitemap

O Discourse incorpora um sitemap localizado em /sitemap.xml, que é habilitado por padrão através da configuração habilitar sitemap. Isso facilita a melhor indexação pelos mecanismos de busca.

Visualização estática para mecanismos de busca

O Discourse possui uma visualização HTML estática sem JavaScript para ajudar os rastreadores da web a indexar seu site mais rapidamente. O conteúdo entre a visualização dinâmica e a estática é idêntico e nada será omitido ou removido quando o site for rastreado pelos mecanismos de busca.

Potenciais problemas com rastreadores da web

Rastreadores da web, também conhecidos como robôs, são essenciais para indexar páginas da web. Alguns rastreadores, no entanto, podem ser excessivamente entusiasmados, bombardeando o fórum com muitas solicitações. O Discourse bloqueia vários rastreadores notórios por padrão, mas permite que você ajuste as configurações de agentes de usuário de rastreador bloqueados, se necessário.

robots.txt

Você pode ver e editar, se necessário, o robots.txt[2]. Este arquivo serve como uma ferramenta para guiar os rastreadores da web sobre como interagir com o conteúdo do fórum. Seu propósito principal é gerenciar o acesso do rastreador, evitando que sobrecarreguem o servidor e ajudando a manter a saúde de SEO do site, evitando a indexação de páginas de baixo valor ou repetitivas.

:warning: Modificar este arquivo sem uma consideração cuidadosa pode prejudicar a indexação do seu site.

Migrações e Redirecionamentos de URL

O recurso de permalink é usado para redirecionar URLs antigas, visando preservar o SEO, evitar erros de "Página Não Encontrada" e auxiliar os mecanismos de busca com os metadados corretos para facilitar a indexação.
Se o seu site da comunidade for migrado para o Discourse por nossa equipe, os redirecionamentos de URL serão incluídos, a menos que haja razões válidas para não fazê-lo.

Se você estiver usando um dos scripts de importação existentes,, você deve garantir que o script lide com isso[3]. Você pode adicionar permalinks manualmente em seu painel de administração, em PersonalizarPermalinks.

Discrepância entre Visualizações de Página do Discourse e Google Analytics

O Discourse e o Google Analytics têm metodologias diferentes ao contar visualizações de página, muitas vezes levando a uma contagem maior de visualizações de página no Discourse. Essa diferença decorre do fato de o Discourse ser uma aplicação de página única, contando assim cada solicitação significativa como uma visualização de página.

Por outro lado, o Google usa JavaScript para contar visualizações de página apenas no carregamento completo da página, excluindo rastreadores da web por padrão. Ao contrário do Google, o Discourse conta as solicitações brutas feitas e emite visualizações de página no primeiro carregamento de uma página ou ao transicionar rotas, tornando seus mecanismos de rastreamento distintos um do outro.

Se você quiser saber mais sobre relatórios de dados e análises, dê uma olhada na categoria dedicada:

Métodos de desindexação

Para remover páginas do índice do Google, você pode remover o conteúdo ou bloquear o acesso a uma página. Dependendo de suas necessidades, você pode tornar todo o seu site privado [4]. Você pode excluir tópicos excluindo-os ou colocando-os em categorias restritas. Tópicos ocultos não são indexados por padrão, mas podem ser se houver um link público em algum lugar que redirecione para ele.

Para uma remoção duradoura, usar a ferramenta de Remoções no Google Search Console é a chave para manter as páginas fora dos resultados de pesquisa.

Saiba mais em Remove information on your website from Google - Search Console Help.


  1. Você pode ler mais sobre isso em Secure Uploads. ↩︎

  2. Procure pela configuração “allow index in robots txt”. ↩︎

  3. Procurar pela string permalink no script de importação deve fornecer essa informação. ↩︎

  4. Procure pela configuração login required. ↩︎

19 curtidas

Obrigado por esta visão geral detalhada de SEO para o Discourse! Como um especialista em SEO trabalhando com várias plataformas, acho muito útil ver como o Discourse lida com elementos essenciais como sitemap.xml e robots.txt. A configuração padrão é bastante amigável para SEO, mas estou curioso para saber se existem alguma prática recomendada ou recomendações de plugins para aprimorar ainda mais o controle de indexação ou a integração de marcação de esquema (schema markup) em fóruns Discourse.

Ansioso para aprender mais com a comunidade e contribuir onde puder!

2 curtidas