Aplicando Schema.org na página de perfil do usuário para melhorar a autoridade do autor no Google

First off, Schema.org is very well applied throughout the forums!

I would like to know however if it could be possible to give an ‘author’ some more authority for Google search results by also applying Schema.org to the profile page and additionally adding the possibility to link social media accounts to that profile.

There’s a Schema.org ProfilePage type which can be found here: ProfilePage - Schema.org Type

Not all will be necessary, but here’s some example markup of how it could be implemented:

<script type="application/ld+json">
{
    "@context" : "http://schema.org",
    "@type" : "ProfilePage",
    "mainEntity" : {
        "@type" : "Person",
        "name" : "Jane Doe",
        "givenName" : "Jane",
        "familyName" : "Doe",
        "email" : "jdoe@examplelaw.com",
        "telephone" : "9195555555",
        "jobTitle" : "Partner",
        "image" : "https://www.examplelaw.com/wp-content/examplelaw/2018/02/jane-doe.jpg",
        "url" : "https://www.examplelaw.com/attorney/jane-doe/",
        "worksFor": {
            "@type": "Organization",
            "name": "Example Law Firm",
            "url": "https://www.examplelaw.com/",
            "address": {
                "@type": "PostalAddress",
                "addressLocality": "Raleigh",
                "addressRegion": "NC",
                "postalCode": "27604",
                "streetAddress": "100 Main Street, Suite 201",
                "addressCountry": "USA"
            }
        },
        "gender": "female",
        "alumniOf": [
            {
                "@type" : "CollegeOrUniversity",
                "name" : "University of North Carolina at Chapel Hill"
            },
            {
                "@type" : "CollegeOrUniversity",
                "name" : "University of North Carolina School of Law"
            }
        ],
        "memberOf": [
            "North Carolina State Bar",
            "Wake County Bar",
            "North Carolina Board Certified Family Law Specialist",
            "Certified Parenting Coordinator",
            "NCDRC Certified Family Financial Mediator"
        ],
        "award": [
            "North Carolina Super Lawyers, Rising Star 2018",
            "Business Leader Magazine, North Carolina Top Family Lawyer"
        ],
        "sameAs": [
            "https://www.facebook.com/JaneDoeAttorney/",
            "https://www.linkedin.com/in/jane-doe-attorney",
            "https://twitter.com/janedoeattorney"
        ]
    }
}
</script>

Where especially ‘sameAs’ would be a welcoming asset.

3 curtidas

By default, the profile page is prohibited from indexing, or am I confusing something?

3 curtidas

Acho que relaxamos isso recentemente, as páginas de perfil agora são indexadas, se bem me lembro.

O que especificamente você propõe para a página de perfil? Apenas o bloco de código que você já postou em sua primeira postagem, @JoshuaH?

1 curtida

Sou a favor desta alteração, aliás. Isso provavelmente será recomendado em breve também para fóruns pelo Google. Links sameAs e interactionStatistics em particular, mas mais informações para auxiliar no agrupamento como as fornecidas aqui também podem ser úteis.

E essa é uma boa recomendação de estrutura geral (ProfilePage → mainEntity → Person). Eu gostaria que houvesse um tipo de conta no schema.org, mas isso tem demorado a ganhar tração, então estamos trabalhando com o que temos.

3 curtidas

A coisa complicada, no entanto, é que nem sequer permitimos a indexação em páginas de utilizador.

Geralmente, vemos estas como páginas de baixo valor para adicionar ao Google.

O Stack Overflow e alguns outros locais permitem a indexação aqui.

Suponho que muito depende da nossa estratégia em torno das páginas de utilizador; são muito possivelmente um vetor de spam e abuso com preocupações de privacidade misturadas.

Potencialmente, se apenas permitíssemos a indexação a grupos particulares e tivéssemos uma vista HTML que fosse melhor do que apenas uma página em branco com um nome de utilizador. Então, faria sentido construir isto como parte deste esforço.

Suponho que uma grande questão é quanto valor um fórum obteria ao ter links de entrada do Google que aterram em perfis de utilizador?

2 curtidas

Boa pergunta.

Um dos nossos problemas em geral é que também usamos a web como nossa fonte de dados para muitas coisas (além do nosso índice de URLs). E há um monte de dados que podem ser úteis para sinais de frescor ou qualidade nessas páginas que não existem em nenhum outro lugar. Do ponto de vista de um fórum, isso nos permitirá principalmente entender melhor os autores do conteúdo no fórum, porque é caro colocar todas essas informações em cada postagem. A esperança seria que isso ajudasse a promover os melhores autores e conteúdos do site de forma melhor e com mais frescor. Mas você levanta um bom ponto de que o ROI é menos óbvio do que nas páginas de discussão. Vou levantar essa questão com outras pessoas no Google.

2 curtidas

Sim, este é absolutamente o problema fundamental. A questão é quanta parte desses dados é suspeita versus confiável.

Nomes, biografias e links para minha página inicial são todos dados fundamentalmente bastante suspeitos. Eles são completamente controlados por um usuário final sem nenhuma forma de validação. Por exemplo, alguém poderia simplesmente usar o nome “Sundar Pichai” e incluir um link para o Google. A última coisa que queremos é que pesquisas pelo CEO do Google direcionem os usuários para este perfil falso.

Com o tempo, à medida que um usuário interage com um fórum, seus dados se tornam menos suspeitos. Por exemplo, se um usuário está ativo há um ano e posta com frequência, podemos confiar que as informações de seu perfil são precisas.

Claro, resolver o problema da identidade é um tanto intratável, e muitos tentaram e falharam.

Outros dados que poderíamos confiar em uma base por usuário poderiam incluir:

  • Lista de distintivos que um usuário possui
  • Tópicos e posts principais que eles publicaram
  • Número de curtidas e reações que eles receberam
  • Idade da conta
  • Grupos públicos dos quais eles são membros

Do ponto de vista da indexação, os operadores do site provavelmente prefeririam que o Google priorizasse a indexação de conteúdo de usuários mais confiáveis primeiro. No entanto, traçar uma linha sobre onde começar é sutil.

No entanto, analisar o sitemap é fundamentalmente tão eficiente que isso pode parecer uma micro-otimização levada longe demais.

2 curtidas

Já lidamos com esse problema para conjuntos de perfis muito maiores do que os fóruns Discourse (como perfis de mídia social). Não que as coisas não passem despercebidas, mas trabalhamos na questão de pessoas que se dizem celebridades há anos e temos muitos sinais para essas coisas. Alguns dos sinais que você mencionou são os tipos de coisas que procuramos. E é precisamente por isso que, quando eles não são indexados ou falhamos em extraí-los, também não sabemos quais postagens e pessoas priorizar. Podemos tentar com base na autoria do conteúdo, mas geralmente faltam alguns sinais.

2 curtidas

Nenhum. A menos que essa pessoa seja pesquisada. E nessa situação, todas as contas de mídia social sobrecarregarão as contas de usuário no Discourse, eu acho.

Em mês passado, o Google adicionou suporte para o esquema DiscussionForumPosting (que o Discourse já faz bem) e o esquema ProfilePage:

Eles atualmente recomendam vincular postagens de discussão a uma página author.url, que é:

Um link para uma página da web que identifica exclusivamente o autor da postagem, muito provavelmente uma página de perfil do fórum. Recomendamos marcar essa página usando dados estruturados de página de perfil.

Pelo que entendi, ter ProfilePages indexadas vinculadas a postagens de discussão é a única maneira de os fóruns serem classificados nas novas Perspectivas de pesquisa do Google. Tudo isso é incompatível com páginas de perfil com noindex.


Dada esta última notícia, você reconsideraria indexar páginas de perfil e adicionar o esquema do OP?

Talvez seja uma boa opção criar uma configuração que permita que as páginas de perfil sejam indexáveis por mecanismos de busca, para que cada administrador da comunidade decida por si mesmo se deseja permitir que os perfis sejam abertos para mecanismos de busca ou não.

Para evitar que spammers usem tais páginas de perfil e o fórum/comunidade Discourse como sua plataforma de link building, pode ser uma boa ideia adicionar outra opção: perfis do fórum permitidos para indexação (podem ser restritos via tag meta) para usuários que atendam a certos critérios: nível de confiança (como na configuração relacionada a posts de wiki), ou ser membro de algum grupo de especialistas verificados, por exemplo. Algumas comunidades podem ter especialistas reais, como médicos, advogados, etc., que estarão mais motivados a participar de conversas se puderem ter uma página de perfil indexável. Eles podem ser especialistas em seu campo, mas não sabem nada sobre SEO, web, etc. Digamos que eles não queiram criar um blog, site ou algo assim. Um link curto para o perfil deles em alguma comunidade Discourse pode ser uma boa opção para eles.

Embora as páginas de perfil não sejam exatamente um fator de classificação, elas ajudam os mecanismos de busca a entender se este artigo ou postagem de fórum em particular é confiável:

1 curtida

O Discourse deve servir uma página de perfil indexável?

Existem diferentes opiniões sobre os prós/contras de páginas de perfil indexáveis.
Resumo algumas delas para defender a adição de uma página de perfil minimalista e indexável.


  1. O Google pode processar o conteúdo do fórum com mais facilidade com páginas de perfil indexáveis referenciadas:
  1. Para “desambiguação”, o Google realmente precisa de pelo menos qualquer tipo de referência ao autor - mesmo que não seja indexável:
  1. Existe um rascunho de schema para uma página de perfil mínima:
  1. Sem carga adicional significativa no Discourse com páginas de perfil indexáveis:

O Google já está rastreando os URLs de perfil, recebe uma resposta com o cabeçalho HTTP X-Robots-Tag: noindex e depois descarta o resultado.

Captura de tela do Google Search Console --&gt; Excluído pela tag 'noindex' (clique para abrir)

Ao servir uma página de perfil minimalista, o Google pode pelo menos usar o resultado de alguma forma.


Minha conclusão

Adicione uma cralwer_view para páginas de perfil que mostre apenas uma marcação de schema minimalista – nenhuma informação adicional é necessária.
A marcação de schema minimalista deve espelhar exatamente os dados que já são apresentados em dados de schema em cada postagem como atributo author:

<html>
  <body itemtype="https://schema.org/ProfilePage" itemscope>
    <span itemprop="mainEntity" itemtype="http://schema.org/Person" itemscope>
      <a itemprop="url" href='https://meta.discourse.org/u/{user_name}'>
        <span itemprop='name'>{user_name}</span>
      </a>
    </span>
  </body>
</html>

Esta é uma "Página de Perfil" válida - veja este exemplo em search.google.com/test/rich-results:

Então, os URLs das páginas de perfil podem se tornar indexáveis novamente.

2 curtidas