Применение Schema.org на странице профиля пользователя для повышения авторитета автора в Google

Прежде всего, Schema.org отлично внедрено на всех страницах форума!

Однако я хотел бы узнать, возможно ли усилить авторитет «автора» в результатах поиска Google, применив Schema.org также к странице профиля и добавив возможность привязки аккаунтов в социальных сетях к этому профилю.

Существует тип Schema.org ProfilePage, который можно найти здесь: ProfilePage - Schema.org Type

Не все поля обязательны, но вот пример разметки того, как это может быть реализовано:

<script type="application/ld+json">
{
    "@context" : "http://schema.org",
    "@type" : "ProfilePage",
    "mainEntity" : {
        "@type" : "Person",
        "name" : "Jane Doe",
        "givenName" : "Jane",
        "familyName" : "Doe",
        "email" : "jdoe@examplelaw.com",
        "telephone" : "9195555555",
        "jobTitle" : "Partner",
        "image" : "https://www.examplelaw.com/wp-content/examplelaw/2018/02/jane-doe.jpg",
        "url" : "https://www.examplelaw.com/attorney/jane-doe/",
        "worksFor": {
            "@type": "Organization",
            "name": "Example Law Firm",
            "url": "https://www.examplelaw.com/",
            "address": {
                "@type": "PostalAddress",
                "addressLocality": "Raleigh",
                "addressRegion": "NC",
                "postalCode": "27604",
                "streetAddress": "100 Main Street, Suite 201",
                "addressCountry": "USA"
            }
        },
        "gender": "female",
        "alumniOf": [
            {
                "@type" : "CollegeOrUniversity",
                "name" : "University of North Carolina at Chapel Hill"
            },
            {
                "@type" : "CollegeOrUniversity",
                "name" : "University of North Carolina School of Law"
            }
        ],
        "memberOf": [
            "North Carolina State Bar",
            "Wake County Bar",
            "North Carolina Board Certified Family Law Specialist",
            "Certified Parenting Coordinator",
            "NCDRC Certified Family Financial Mediator"
        ],
        "award": [
            "North Carolina Super Lawyers, Rising Star 2018",
            "Business Leader Magazine, North Carolina Top Family Lawyer"
        ],
        "sameAs": [
            "https://www.facebook.com/JaneDoeAttorney/",
            "https://www.linkedin.com/in/jane-doe-attorney",
            "https://twitter.com/janedoeattorney"
        ]
    }
}
</script>

Особенно поле «sameAs» стала бы очень полезным дополнением.

3 лайка

По умолчанию страница профиля запрещена для индексации, или я что-то путаю?

3 лайка

Нам кажется, что мы недавно это ослабили — страницы профилей теперь индексируются, насколько я помню.

Что именно вы предлагаете для страницы профиля? Только блок кода, который вы уже опубликовали в своём первом сообщении @JoshuaH?

1 лайк

Кстати, я поддерживаю это изменение. Скорее всего, скоро Google также начнет рекомендовать это для форумов. В частности, ссылки sameAs и interactionStatistics, но также может быть полезна дополнительная информация, помогающая в кластеризации, например, указание того, что данные предоставлены конкретным лицом.

Это также хорошая общая рекомендация по структуре (ProfilePage → mainEntity → Person). Я бы хотел, чтобы в schema.org был тип аккаунта, но он пока не получил широкого распространения, поэтому мы работаем с тем, что есть.

3 лайка

Сложность в том, что мы даже не разрешаем индексацию страниц пользователей.

Как правило, мы считаем такие страницы малоценными для добавления в Google.

Stack Overflow и несколько других платформ разрешают индексацию здесь.

Полагаю, многое зависит от нашей стратегии в отношении страниц пользователей: они могут быть вектором для спама и злоупотреблений, а также вызывать вопросы конфиденциальности.

Возможно, если бы мы разрешили индексацию только для определённых групп и предоставили HTML-представление, которое было бы лучше, чем просто пустая страница с именем пользователя, тогда имело бы смысл реализовать это в рамках данной задачи.

Главный вопрос: какую пользу форум получит от входящих ссылок Google, ведущих на профили пользователей?

2 лайка

Вопрос справедлив.

Одна из наших общих проблем заключается в том, что мы также используем веб-страницы в качестве источника данных для множества задач (в дополнение к нашему индексу URL). На этих страницах содержится много информации, полезной для сигналов свежести или качества, которой нет больше нигде. С точки зрения форума, это позволит нам лучше понять авторов контента, так как хранить всю эту информацию в каждом посте было бы слишком затратно. Мы надеемся, что это поможет эффективнее продвигать лучших авторов и качественный контент на сайте, обеспечивая при этом большую актуальность. Однако вы справедливо отмечаете, что окупаемость здесь менее очевидна, чем на страницах обсуждений. Я подниму этот вопрос с коллегами в Google.

2 лайка

Да, это абсолютно фундаментальная проблема. Вопрос в том, насколько эти данные вызывают подозрения по сравнению с надежными.

Имена, биографии и ссылки на мою домашнюю страницу — это в корне подозрительные данные. Они полностью контролируются конечным пользователем без какой-либо формы проверки. Например, кто-то может просто использовать имя «Сундар Пичаи» и добавить ссылку на Google. Последнее, чего мы хотим, — чтобы поисковые запросы по запросу «генеральный директор Google» перенаправляли пользователей на этот фальшивый профиль.

Со временем, по мере того как пользователь взаимодействует с форумом, его данные становятся менее подозрительными. Например, если пользователь присутствует на форуме уже год и часто публикует сообщения, мы можем доверять точности информации в его профиле.

Конечно, решение проблемы идентификации в некоторой степени неразрешимо, и многие пытались, но потерпели неудачу.

Другие данные, которым мы могли бы доверять на основе каждого пользователя, могут включать:

  • Список значков, полученных пользователем
  • Основные темы и сообщения, которые он опубликовал
  • Количество полученных лайков и реакций
  • Возраст учетной записи
  • Публичные группы, в которых он состоит

С точки зрения индексации администраторы сайтов, вероятно, предпочли бы, чтобы Google в первую очередь индексировал контент от более надежных пользователей. Однако провести четкую границу, с чего начать, — задача тонкая.

Однако сканирование карты сайта настолько эффективно, что это может показаться чрезмерной микр-оптимизацией.

2 лайка

Мы уже решаем эту проблему для гораздо больших наборов профилей, чем форумы Discourse (например, профили в социальных сетях). Не то чтобы всё проходило без сбоев, но мы работаем над вопросом людей, утверждающих, что они знаменитости, уже много лет, и у нас есть множество сигналов для выявления таких случаев. Некоторые из упомянутых вами сигналов — это именно то, на что мы обращаем внимание. Именно поэтому, когда они не индексируются или мы не можем их извлечь, нам сложнее определить, какие посты и людей следует приоритизировать. Мы можем попробовать ориентироваться на авторство контента, но обычно не хватает некоторых сигналов.

2 лайка

Никакой. Разве что если этого человека ищут. И в такой ситуации все аккаунты в социальных сетях будут затмевать аккаунты пользователей в Discourse, полагаю.

С прошлого месяца Google добавил поддержку схемы DiscussionForumPosting (с чем Discourse уже хорошо справляется) и схемы ProfilePage:

Они сейчас рекомендуют связывать сообщения на форуме со страницей author.url, которая представляет собой:

Ссылку на веб-страницу, однозначно идентифицирующую автора сообщения (чаще всего это страница профиля на форуме). Мы рекомендуем размечать эту страницу с помощью структурированных данных для страниц профиля.

Насколько я могу судить, наличие проиндексированных страниц ProfilePage, связанных с сообщениями на форуме, — это единственный способ для форумов ранжироваться в новом поиске Google Perspectives. Всё это несовместимо со страницами профилей, помеченными как noindex.


Учитывая эти последние новости, не могли бы вы пересмотреть решение об индексации страниц профилей и добавлении схемы из первого сообщения?

Возможно, хорошим решением будет добавить настройку, позволяющую делать страницы профилей доступными для индексации поисковыми системами, чтобы каждый администратор сообщества мог самостоятельно решить, разрешать ли индексацию профилей или нет.

Чтобы предотвратить использование спамерами таких страниц профилей и форумов Discourse в качестве платформы для наращивания ссылочной массы, стоит рассмотреть возможность добавления ещё одной опции: индексация профилей форума (с возможностью ограничения через мета-тег) только для пользователей, соответствующих определённым критериям — например, уровень доверия (как в настройках, связанных с вики-постами), или принадлежность к группе верифицированных экспертов. Некоторые сообщества могут включать реальных специалистов, таких как врачи, юристы и другие, которые будут более мотивированы участвовать в обсуждениях, если у них будет возможность иметь индексированную страницу профиля. Они могут быть экспертами в своей области, но ничего не знать о SEO, веб-технологиях и т. п. Предположим, они не хотят создавать блог, сайт или что-то подобное. Короткая ссылка на их профиль в сообществе Discourse может стать для них отличным вариантом.

Хотя страницы профилей не являются прямым фактором ранжирования, они помогают поисковым системам понять, насколько достоверна конкретная статья или сообщение на форуме:

1 лайк

Должен ли Discourse предоставлять индексируемую страницу профиля?

Существуют различные мнения о преимуществах и недостатках индексируемых страниц профиля.
Я кратко изложу некоторые из них, чтобы обосновать идею добавления минималистичной индексируемой страницы профиля.


  1. Google может легче обрабатывать контент форума, если существуют ссылки на индексируемые страницы профиля:
  1. Для «разрешения неоднозначностей» Google действительно нужна хотя бы какая-либо ссылка на автора — даже если она не индексируется:
  1. Существует черновик схемы для минималистичной страницы профиля:
  1. Индексируемые страницы профиля не создают значительной дополнительной нагрузки на Discourse:

Google уже обходит URL-адреса профилей, получает ответ с HTTP-заголовком X-Robots-Tag: noindex, а затем отбрасывает результат.

Скриншот Google Search Console --> Исключено по тегу 'noindex' (нажмите, чтобы открыть)

Предоставляя минималистичную страницу профиля, Google сможет хотя бы как-то использовать результат.


Мой вывод

Добавить crawler_view для страниц профиля, который будет показывать только минималистичную разметку схемы — никакой дополнительной информации не требуется.
Минималистичная разметка схемы должна в точности соответствовать данным, которые уже представлены в разметке схемы в каждом сообщении как атрибут author:

<html>
  <body itemtype="https://schema.org/ProfilePage" itemscope>
    <span itemprop="mainEntity" itemtype="http://schema.org/Person" itemscope>
      <a itemprop="url" href='https://meta.discourse.org/u/{user_name}'>
        <span itemprop='name'>{user_name}</span>
      </a>
    </span>
  </body>
</html>

Это валидная «страница профиля» — см. этот пример на search.google.com/test/rich-results:

Тогда URL-адреса страниц профиля снова смогут индексироваться.

2 лайка