Aplicando Schema.org en la página de perfil de usuario para mejorar la autoridad del autor en Google

First off, Schema.org is very well applied throughout the forums!

I would like to know however if it could be possible to give an ‘author’ some more authority for Google search results by also applying Schema.org to the profile page and additionally adding the possibility to link social media accounts to that profile.

There’s a Schema.org ProfilePage type which can be found here: ProfilePage - Schema.org Type

Not all will be necessary, but here’s some example markup of how it could be implemented:

<script type="application/ld+json">
{
    "@context" : "http://schema.org",
    "@type" : "ProfilePage",
    "mainEntity" : {
        "@type" : "Person",
        "name" : "Jane Doe",
        "givenName" : "Jane",
        "familyName" : "Doe",
        "email" : "jdoe@examplelaw.com",
        "telephone" : "9195555555",
        "jobTitle" : "Partner",
        "image" : "https://www.examplelaw.com/wp-content/examplelaw/2018/02/jane-doe.jpg",
        "url" : "https://www.examplelaw.com/attorney/jane-doe/",
        "worksFor": {
            "@type": "Organization",
            "name": "Example Law Firm",
            "url": "https://www.examplelaw.com/",
            "address": {
                "@type": "PostalAddress",
                "addressLocality": "Raleigh",
                "addressRegion": "NC",
                "postalCode": "27604",
                "streetAddress": "100 Main Street, Suite 201",
                "addressCountry": "USA"
            }
        },
        "gender": "female",
        "alumniOf": [
            {
                "@type" : "CollegeOrUniversity",
                "name" : "University of North Carolina at Chapel Hill"
            },
            {
                "@type" : "CollegeOrUniversity",
                "name" : "University of North Carolina School of Law"
            }
        ],
        "memberOf": [
            "North Carolina State Bar",
            "Wake County Bar",
            "North Carolina Board Certified Family Law Specialist",
            "Certified Parenting Coordinator",
            "NCDRC Certified Family Financial Mediator"
        ],
        "award": [
            "North Carolina Super Lawyers, Rising Star 2018",
            "Business Leader Magazine, North Carolina Top Family Lawyer"
        ],
        "sameAs": [
            "https://www.facebook.com/JaneDoeAttorney/",
            "https://www.linkedin.com/in/jane-doe-attorney",
            "https://twitter.com/janedoeattorney"
        ]
    }
}
</script>

Where especially ‘sameAs’ would be a welcoming asset.

3 Me gusta

By default, the profile page is prohibited from indexing, or am I confusing something?

3 Me gusta

Creo que relajamos eso recientemente, las páginas de perfil ahora están indexadas, si mal no recuerdo.

¿Qué propones específicamente para la página de perfil? ¿Solo el bloque de código que ya publicaste en tu primera publicación @JoshuaH?

1 me gusta

Estoy a favor de este cambio, por cierto. Es probable que Google pronto recomiende esto también para los foros. Los enlaces sameAs y interactionStatistics en particular, pero más información para ayudar en la agrupación como la que se da aquí también puede ser útil.

Y esa es una buena recomendación de estructura general (ProfilePage → mainEntity → Person). Desearía que hubiera un tipo de cuenta en schema.org, pero eso ha tardado en ganar terreno, así que estamos trabajando con lo que tenemos.

3 Me gusta

Lo complicado es que ni siquiera permitimos la indexación en las páginas de usuario.

Generalmente las vemos como páginas de bajo valor para añadir a Google.

Stack Overflow y algunos otros lugares sí permiten la indexación aquí.

Supongo que mucho depende de nuestra estrategia en torno a las páginas de usuario, es muy posible que sean un vector de spam y abuso con preocupaciones de privacidad mezcladas.

Potencialmente, si solo permitiéramos la indexación a grupos particulares y tuviéramos una vista HTML que fuera mejor que una página en blanco con un nombre de usuario. Entonces tendría sentido construir esto como parte de este esfuerzo.

Supongo que una gran pregunta es cuánto valor obtendría un foro de tener enlaces entrantes de Google que lleguen a los perfiles de usuario.

2 Me gusta

Buena pregunta.

Uno de nuestros problemas en general es que también usamos la web como fuente de datos para muchas cosas (además de nuestro índice de URL). Y hay un montón de datos que pueden ser útiles para señales de frescura o calidad en esas páginas que no están en ningún otro lugar. Desde el punto de vista de un foro, principalmente nos permitirá comprender mejor a los autores del contenido en el foro, porque es costoso incluir toda esa información en cada publicación. La esperanza sería que ayudara a promocionar a los mejores autores y contenido del sitio mejor y con más frescura. Pero usted plantea un buen punto de que el ROI es menos obvio que en las páginas de discusión. Plantearé ese problema con otros en Google.

2 Me gusta

Sí, este es absolutamente el problema fundamental. El problema es cuántos de estos datos son sospechosos en comparación con los confiables.

Los nombres, las biografías y los enlaces a mi página de inicio son datos fundamentalmente bastante sospechosos. Están completamente controlados por un usuario final sin ningún tipo de validación. Por ejemplo, alguien podría usar simplemente el nombre “Sundar Pichai” e incluir un enlace a Google. Lo último que queremos es que las búsquedas del CEO de Google dirijan a los usuarios a este perfil falso.

Con el tiempo, a medida que un usuario interactúa con un foro, sus datos se vuelven menos sospechosos. Por ejemplo, si un usuario ha estado activo durante un año y publica con frecuencia, podríamos confiar en que la información de su perfil es precisa.

Por supuesto, resolver el problema de la identidad es algo intratable, y muchos lo han intentado y han fracasado.

Otros datos en los que podríamos confiar por usuario podrían incluir:

  • Lista de insignias que tiene un usuario
  • Temas y publicaciones principales que ha publicado
  • Número de me gusta y reacciones que ha recibido
  • Antigüedad de la cuenta
  • Grupos públicos de los que es miembro

Desde una perspectiva de indexación, los operadores del sitio probablemente preferirían que Google priorizara la indexación de contenido de usuarios más confiables primero. Sin embargo, trazar una línea sobre dónde comenzar es matizado.

Sin embargo, escanear el sitemap es fundamentalmente tan eficiente que esto podría parecer una microoptimización llevada demasiado lejos.

2 Me gusta

Ya hemos abordado este problema para conjuntos de perfiles mucho más grandes que los foros de Discourse (como los perfiles de redes sociales). No es que no se nos escape nada, pero hemos estado trabajando en el problema de las personas que afirman ser celebridades durante años y tenemos muchas señales para estas cosas. Algunas de las señales que mencionaste son el tipo de cosas que buscamos. Y es precisamente por eso que cuando no se indexan o no logramos extraerlos, tampoco sabemos qué publicaciones y personas priorizar. Podemos intentarlo basándonos en la autoría del contenido, pero generalmente carece de algunas señales.

2 Me gusta

Ninguno. A menos que esa persona sea buscada. Y en esa situación, todas las cuentas de redes sociales superarán a las cuentas de usuario en Discourse, supongo.

A partir de el mes pasado Google añadió soporte para el esquema DiscussionForumPosting (que Discourse ya hace bien) y el esquema ProfilePage:

Actualmente recomiendan vincular las publicaciones de discusión a una página author.url que es:

Un enlace a una página web que identifica de forma única al autor de la publicación, lo más probable es que sea una página de perfil del foro. Recomendamos marcar esa página utilizando datos estructurados de página de perfil.

Hasta donde yo sé, tener páginas ProfilePage indexadas vinculadas a publicaciones de discusión es la única forma de que los foros se clasifiquen en las nuevas Perspectives de búsqueda de Google. Todo esto es incompatible con las páginas de perfil no indexadas.


Dadas estas últimas noticias, ¿reconsiderarían indexar las páginas de perfil y añadir el esquema del OP?

Quizás sea una buena opción crear una configuración que permita que las páginas de perfil sean indexables por los motores de búsqueda, para que cada administrador de la comunidad decida por sí mismo si desea permitir que los perfiles estén abiertos a los motores de búsqueda o no.

Para evitar que los spammers utilicen dichas páginas de perfil y el foro/comunidad de Discourse como su plataforma de creación de enlaces, podría ser una buena idea agregar otra opción: los perfiles del foro pueden ser indexados (se puede restringir a través de la etiqueta meta) para usuarios que cumplan ciertos criterios: nivel de confianza (como en la configuración relacionada con las publicaciones wiki), o ser miembro de algún grupo de expertos verificados, por ejemplo. Algunas comunidades pueden tener expertos reales como médicos, abogados, etc., que estarán más motivados a participar en conversaciones si pueden tener una página de perfil indexable. Pueden ser expertos en su campo pero no saber nada sobre SEO, web, etc. Digamos que no quieren crear un blog, sitio web o algo similar. Un enlace corto a su perfil en alguna comunidad de Discourse podría ser una buena opción para ellos.

Aunque las páginas de perfil no son exactamente un factor de clasificación, ayudan a los motores de búsqueda a comprender si este artículo o publicación de foro en particular es confiable:

1 me gusta

¿Debería Discourse servir una página de perfil indexable?

Existen diferentes opiniones sobre los pros y los contras de las páginas de perfil indexables.
Resumo algunas de ellas para argumentar a favor de añadir una página de perfil minimalista e indexable.


  1. Google puede procesar más fácilmente el contenido del foro con páginas de perfil indexables referenciadas:
  1. Para la “desambiguación”, Google realmente necesita al menos algún tipo de referencia al autor, incluso si no es indexable:
  1. Existe un borrador de esquema para una página de perfil mínima:
  1. No hay una gran carga adicional en Discourse con páginas de perfil indexables:

Google ya está rastreando las URL de los perfiles, recibe una respuesta con la cabecera HTTP X-Robots-Tag: noindex y luego descarta el resultado.

Captura de pantalla de Google Search Console --&gt; Excluido por la etiqueta 'noindex' (haga clic para abrir)

Al servir una página de perfil minimalista, Google puede al menos utilizar el resultado de alguna manera.


Mi conclusión

Añadir una cralwer_view para las páginas de perfil que muestre solo un marcado de esquema minimalista, sin información adicional.
El marcado de esquema minimalista debe parecerse exactamente a los datos que ya se presentan en los datos de esquema en cada publicación como atributo author:

<html>
  <body itemtype="https://schema.org/ProfilePage" itemscope>
    <span itemprop="mainEntity" itemtype="http://schema.org/Person" itemscope>
      <a itemprop="url" href='https://meta.discourse.org/u/{user_name}'>
        <span itemprop='name'>{user_name}</span>
      </a>
    </span>
  </body>
</html>

Esta es una “Página de perfil” válida, consulte este ejemplo en search.google.com/test/rich-results:

Entonces, las URL de las páginas de perfil pueden volver a ser indexables.

2 Me gusta