Appliquer Schema.org sur la page de profil utilisateur pour améliorer l'autorité de l'auteur sur Google

First off, Schema.org is very well applied throughout the forums!

I would like to know however if it could be possible to give an ‘author’ some more authority for Google search results by also applying Schema.org to the profile page and additionally adding the possibility to link social media accounts to that profile.

There’s a Schema.org ProfilePage type which can be found here: ProfilePage - Schema.org Type

Not all will be necessary, but here’s some example markup of how it could be implemented:

<script type="application/ld+json">
{
    "@context" : "http://schema.org",
    "@type" : "ProfilePage",
    "mainEntity" : {
        "@type" : "Person",
        "name" : "Jane Doe",
        "givenName" : "Jane",
        "familyName" : "Doe",
        "email" : "jdoe@examplelaw.com",
        "telephone" : "9195555555",
        "jobTitle" : "Partner",
        "image" : "https://www.examplelaw.com/wp-content/examplelaw/2018/02/jane-doe.jpg",
        "url" : "https://www.examplelaw.com/attorney/jane-doe/",
        "worksFor": {
            "@type": "Organization",
            "name": "Example Law Firm",
            "url": "https://www.examplelaw.com/",
            "address": {
                "@type": "PostalAddress",
                "addressLocality": "Raleigh",
                "addressRegion": "NC",
                "postalCode": "27604",
                "streetAddress": "100 Main Street, Suite 201",
                "addressCountry": "USA"
            }
        },
        "gender": "female",
        "alumniOf": [
            {
                "@type" : "CollegeOrUniversity",
                "name" : "University of North Carolina at Chapel Hill"
            },
            {
                "@type" : "CollegeOrUniversity",
                "name" : "University of North Carolina School of Law"
            }
        ],
        "memberOf": [
            "North Carolina State Bar",
            "Wake County Bar",
            "North Carolina Board Certified Family Law Specialist",
            "Certified Parenting Coordinator",
            "NCDRC Certified Family Financial Mediator"
        ],
        "award": [
            "North Carolina Super Lawyers, Rising Star 2018",
            "Business Leader Magazine, North Carolina Top Family Lawyer"
        ],
        "sameAs": [
            "https://www.facebook.com/JaneDoeAttorney/",
            "https://www.linkedin.com/in/jane-doe-attorney",
            "https://twitter.com/janedoeattorney"
        ]
    }
}
</script>

Where especially ‘sameAs’ would be a welcoming asset.

3 « J'aime »

By default, the profile page is prohibited from indexing, or am I confusing something?

3 « J'aime »

Je pense que nous avons assoupli cela récemment, les pages de profil sont maintenant indexées, si je me souviens bien.

Que proposez-vous spécifiquement pour la page de profil ? Juste le bloc de code que vous avez déjà posté dans votre premier message @JoshuaH ?

1 « J'aime »

Je suis favorable à ce changement, d’ailleurs. Ceci sera probablement bientôt recommandé également pour les forums par Google. Les liens sameAs et interactionStatistics en particulier, mais plus d’informations pour aider au regroupement comme celles fournies ici peuvent également être utiles.

Et c’est une bonne recommandation de structure générale (ProfilePage → mainEntity → Person). J’aurais aimé qu’il existe un type de compte dans schema.org, mais cela a mis du temps à prendre de l’ampleur, nous travaillons donc avec ce que nous avons.

3 « J'aime »

La chose délicate cependant est que nous n’autorisons même pas l’indexation sur les pages utilisateur.

En général, nous les considérons comme des pages de faible valeur à ajouter à Google.

Stack Overflow et quelques autres endroits autorisent l’indexation ici.

Je suppose que beaucoup dépend de notre stratégie concernant les pages utilisateur, elles sont très probablement un vecteur de spam et d’abus avec des préoccupations de confidentialité mêlées.

Potentiellement, si nous n’autorisions l’indexation qu’à des groupes particuliers et que nous avions une vue HTML meilleure qu’une simple page vierge avec un nom d’utilisateur. Alors cela aurait du sens de construire cela dans le cadre de cet effort.

Je suppose qu’une grande question est de savoir quelle valeur un forum obtiendrait en ayant des liens Google entrants qui atterrissent sur des profils utilisateur ?

2 « J'aime »

Bonne question.

L’un de nos problèmes en général est que nous utilisons également le Web comme source de données pour de nombreuses choses (en plus de notre index d’URL). Et il existe un tas de données qui peuvent être utiles pour la fraîcheur ou les signaux de qualité sur ces pages qui n’existent nulle part ailleurs. Du point de vue d’un forum, cela nous permettra principalement de mieux comprendre les auteurs du contenu du forum, car il est coûteux d’inclure toutes ces informations sur chaque publication. L’espoir serait que cela permette de mieux promouvoir les meilleurs auteurs et le meilleur contenu sur le site, avec plus de fraîcheur. Mais vous soulevez un bon point, le retour sur investissement est moins évident que sur les pages de discussion. Je soulèverai cette question avec d’autres personnes chez Google.

2 « J'aime »

Oui, c’est absolument le problème fondamental. La question est de savoir quelle part de ces données est suspecte par rapport à ce qui est fiable.

Les noms, les biographies et les liens vers ma page d’accueil sont des données fondamentalement assez suspectes. Ils sont entièrement contrôlés par un utilisateur final sans aucune forme de validation. Par exemple, quelqu’un pourrait simplement utiliser le nom « Sundar Pichai » et inclure un lien vers Google. La dernière chose que nous voulons, c’est que les recherches du PDG de Google redirigent les utilisateurs vers ce faux profil.

Au fil du temps, à mesure qu’un utilisateur interagit avec un forum, ses données deviennent moins suspectes. Par exemple, si un utilisateur est présent depuis un an et publie fréquemment, nous pourrions faire confiance à l’exactitude des informations de son profil.

Bien sûr, résoudre le problème de l’identité est quelque peu insoluble, et beaucoup ont essayé et échoué.

D’autres données que nous pourrions faire confiance sur une base par utilisateur pourraient inclure :

  • Liste des badges qu’un utilisateur possède
  • Principaux sujets et publications qu’il a publiés
  • Nombre de likes et de réactions qu’il a reçus
  • Âge du compte
  • Groupes publics dont il est membre

D’un point de vue de l’indexation, les opérateurs de sites préféreraient probablement que Google priorise l’indexation du contenu des utilisateurs les plus fiables en premier. Cependant, tracer une ligne sur où commencer est nuancé.

Cependant, l’analyse du sitemap est fondamentalement si efficace que cela pourrait sembler être une micro-optimisation poussée trop loin.

2 « J'aime »

Nous avons déjà résolu ce problème pour des ensembles de profils beaucoup plus importants que les forums Discourse (comme les profils de réseaux sociaux). Non pas que des choses ne passent pas entre les mailles du filet, mais nous travaillons sur le problème des personnes qui se prétendent célébrités depuis des années et nous avons beaucoup de signaux pour ces choses. Certains des signaux que vous avez mentionnés sont le type de choses que nous recherchons. Et c’est précisément pourquoi, lorsqu’ils ne sont pas indexés ou que nous ne parvenons pas à les extraire, nous ne savons pas non plus quels messages et quelles personnes prioriser. Nous pouvons essayer en fonction de l’auteur du contenu, mais cela manque généralement de certains signaux.

2 « J'aime »

Aucune. À moins que cette personne ne soit recherchée. Et dans ce cas, tous les comptes de réseaux sociaux surpasseront les comptes d’utilisateurs sur Discourse, je pense.

Depuis le mois dernier, Google a ajouté la prise en charge du schéma DiscussionForumPosting (que Discourse gère déjà très bien) et du schéma ProfilePage :

Ils recommandent actuellement de lier les publications de discussion à une page author.url qui est :

Un lien vers une page Web qui identifie de manière unique l’auteur de la publication, très probablement une page de profil du forum. Nous vous recommandons de baliser cette page à l’aide des données structurées de la page de profil.

D’après ce que j’ai compris, avoir des ProfilePage indexées liées aux publications de discussion est le seul moyen pour les forums d’être classés dans les nouvelles Perspectives de recherche de Google. Tout cela est incompatible avec les pages de profil noindexées.


Compte tenu de cette dernière nouvelle, reconsidéreriez-vous l’indexation des pages de profil et l’ajout du schéma de l’OP ?

Peut-être que ce serait une bonne option de créer un paramètre qui permettrait aux pages de profil d’être indexables par les moteurs de recherche, afin que chaque administrateur de communauté décide lui-même s’il souhaite autoriser l’ouverture des profils aux moteurs de recherche ou non.

Afin d’empêcher les spammeurs d’utiliser de telles pages de profil et le forum/la communauté Discourse comme plateforme de création de liens, il pourrait être judicieux d’ajouter une autre option : les profils de forum autorisés à être indexés (peuvent être restreints via une balise meta) pour les utilisateurs qui répondent à certains critères : niveau de confiance (comme dans le paramètre lié aux articles wiki), ou appartenance à un groupe d’experts vérifiés par exemple. Certaines communautés peuvent avoir de vrais experts tels que des médecins, des avocats, etc. qui seront plus motivés à participer aux conversations s’ils peuvent avoir une page de profil indexable. Ils peuvent être experts dans leur domaine mais ne rien connaître au SEO, au web, etc. Disons qu’ils ne veulent pas créer de blog, de site web ou quelque chose de similaire. Un lien court vers leur profil sur une communauté Discourse pourrait être une bonne option pour eux.

Bien que les pages de profil ne soient pas exactement un facteur de classement, elles aident les moteurs de recherche à comprendre si cet article ou ce message de forum particulier est digne de confiance :

1 « J'aime »

Discourse doit-il servir une page de profil indexable ?

Il existe différentes opinions sur les avantages/inconvénients des pages de profil indexables.
J’en résume quelques-unes pour argumenter en faveur de l’ajout d’une page de profil minimaliste et indexable.


  1. Google peut traiter plus facilement le contenu du forum avec des pages de profil indexables référencées :
  1. Pour la « désambiguïsation », Google a besoin au moins d’une référence à l’auteur, même si elle n’est pas indexable :
  1. Il existe un brouillon de schéma pour une page de profil minimale :
  1. Pas de charge supplémentaire importante sur Discourse avec des pages de profil indexables :

Google explore déjà les URL de profil, obtient une réponse avec l’en-tête HTTP X-Robots-Tag: noindex, puis jette le résultat.

Capture d'écran Google Search Console -- > Exclu par le tag 'noindex' (cliquer pour ouvrir)

En servant une page de profil minimaliste, Google peut au moins utiliser le résultat d’une manière ou d’une autre.


Ma conclusion

Ajouter une cralwer_view pour les pages de profil qui affiche uniquement un balisage de schéma minimaliste – aucune information supplémentaire n’est nécessaire.
Le balisage de schéma minimaliste doit ressembler exactement aux données déjà présentées dans les données de schéma sur chaque message en tant qu’attribut author :

<html>
  <body itemtype="https://schema.org/ProfilePage" itemscope>
    <span itemprop="mainEntity" itemtype="http://schema.org/Person" itemscope>
      <a itemprop="url" href='https://meta.discourse.org/u/{user_name}'>
        <span itemprop='name'>{user_name}</span>
      </a>
    </span>
  </body>
</html>

Ceci est une page de profil valide » - voir cet exemple sur search.google.com/test/rich-results :

Les URL des pages de profil peuvent alors redevenir indexables.

2 « J'aime »