Улучшения схемы форума обсуждений

hiccup · 03.Декабрь.2023 20:07:59

Здравствуйте. В настоящее время мы получаем это сообщение в Google Search Console. Я не совсем уверен, что оно означает. Не могли бы вы прояснить эту проблему? Есть ли решение? Кроме того, хочу отметить, что мы пробовали использовать различные темы для платформы, но ошибка сохраняется.

Arkshine · 04.Декабрь.2023 00:16:05

Привет, икляп!

Структурированные данные, по сути, помогают поисковым системам получить больше контекста.

Поиск Google не находит необязательное поле url в этой теме.
Вы можете увидеть на validator.schema.org, что это абсолютно корректно без каких-либо предупреждений.

Волноваться не о чем.
Тем не менее, если Поиск Google подсветит это поле, это станет веской причиной добавить его в Discourse.

techAPJ · 04.Декабрь.2023 05:55:20

Как объяснил выше @Arkshine, это не ошибка, а предложение от Google добавить необязательное поле в схему. Я изучу этот вопрос.

dfabulich · 17.Декабрь.2023 23:00:37

Из другой темы:

Dan Fabulich, пост:8, тема:286762, full:true:

Вы можете проверить отчёт в Google Search Console, но когда я перехожу на https://search.google.com/search-console/r/discussion-forum и проверяю свой форум, я вижу следующее:

image1908×1588 211 KB

Почему элементы недопустимы:

Должен быть указан хотя бы один из параметров: «text», «image» или «video»

Отсутствует обязательное поле «datePublished»

Отсутствует обязательное поле «author»

Улучшение отображения элемента

Отсутствует обязательное поле «url»

Отсутствует обязательное поле «text» (в «comment»)

Итак, похоже, что здесь ещё предстоит проделать работу.

Так что да, поле «url» является необязательным, но здесь также есть реальные ошибки.

rrit · 17.Декабрь.2023 23:10:04

Атрибут itemprop="url" помогает Google объединять несколько блоков Comment на разных URL, относящихся к одной теме.

techAPJ · 26.Декабрь.2023 13:36:52

Я попытался воспроизвести ошибки, которые вы видите, протестировав мета-темы в Google Rich Results Test, но не обнаружил никаких ошибок.

Можете ли вы предоставить ссылку на тему, для которой Google показывает ошибки?

dfabulich · 26.Декабрь.2023 18:59:50

Первое, на что стоит обратить внимание, — это то, что ссылка, которую вы показали, указывает на отсутствие схемы «Форум обсуждений». Эта ссылка содержит только схему «Хлебные крошки», без какой-либо схемы «Форум обсуждений». Это происходит потому, что вы тестируете ссылку в режиме «смартфон», а не в режиме «десктоп».

https://search.google.com/test/rich-results/result?id=TlLcA6saLMo3BrxbQYnFuw

При переключении на тестирование ссылки в режиме десктоп появляется схема «Форум обсуждений», и система указывает на проблему «отсутствующее поле url».

Чтобы воспроизвести критические ошибки, необходимо протестировать длинную ветку с параметром URL ?page=2, например, как в этом случае:

dfabulich · 26.Декабрь.2023 19:01:44

Я должен отметить, что, на мой взгляд, это важная ошибка в Discourse: схема не отображается в режиме для смартфонов. Google не стал бы помечать это как ошибку (поскольку Google помечает только ошибки в схемах, которые присутствуют), но краулинг и индексация для смартфонов уже много лет являются стандартными для Google, поэтому крайне важно, чтобы любая схема отображалась как в режиме для смартфонов, так и в режиме для настольных компьютеров.

techAPJ · 27.Декабрь.2023 10:55:23

Проблема, описанная в первом сообщении, а также некоторые другие ошибки были исправлены в этом коммите:

Спасибо за предложения здесь, @rrit!

Это происходит потому, что в режиме просмотра для поисковых роботов первое сообщение не включается со второй страницы и далее. @sam, стоит ли включать первое сообщение на всех страницах в режиме просмотра для роботов, чтобы исправить проблемы со схемой?

sam · 27.Декабрь.2023 21:35:50

Нет, я так не думаю, дублирование контента никогда не заканчивается хорошо. Есть ли другие варианты?

techAPJ · 28.Декабрь.2023 07:39:04

Другой вариант — заменить микроданные schema на JSON-LD (что рекомендует Google). Это позволит разделить отрисованные данные и структурированные данные, а также обеспечит работу на мобильных устройствах (как отметил Дэн выше).

Мы уже используем схему JSON-LD в плагине solved.

sam · 28.Декабрь.2023 23:43:10

Конечно, это звучит как гораздо более правильное решение.

rrit · 30.Декабрь.2023 15:44:28

Не включайте данные/текст первого поста на последующих страницах, но всегда добавляйте itemprop="url", указывающий на первую страницу:

Смотрите Google structured data for forums and profile pages - #9 by rrit

rrit · 30.Декабрь.2023 15:48:06

Нет правила без исключений: для DiscussionForumPosting Google рекомендует использовать Microdata, а не JSON-LD.

См. Discussion Forum (DiscussionForumPosting, SocialMediaPosting) Schema Markup | Google Search Central | Documentation | Google for Developers

Технические рекомендации

В отличие от нашей общей рекомендации по использованию структурированных данных, мы советуем размечать DiscussionForumPosting с помощью микроданных (или RDFa), если это возможно. Это избавит вас от необходимости дублировать большие текстовые блоки внутри разметки. Однако это лишь рекомендация, и JSON-LD по-прежнему полностью поддерживается.

rrit · 30.Декабрь.2023 15:51:36

Этот фикс уже работает на meta.discourse.org?

Пожалуйста, ознакомьтесь с моим комментарием на GitHub:

Весь этот тег link должен определяться только для post.is_first_post — нет необходимости дублировать его с идентичным URL для каждого элемента Comment.

На meta.discourse.org кавычки в данный момент отображаются некорректно:
<link itemprop='mainEntityOfPage' href="…">
См. Schema Markup Validator

techAPJ · 01.Январь.2024 08:25:09

Да, мы сейчас делаем это согласно недавнему коммиту, но даже после его добавления на последующих страницах (?page=2) отсутствуют некоторые обязательные поля (author, datePublished, text).

Отличное замечание! Исправлено в этом PR:

Да, верно. Это также подтвердил @rrlevering здесь:

Похоже, нам придётся улучшить схему Microdata, убедившись при этом, что мы не будем дублировать контент на последующих страницах.

rrit · 01.Январь.2024 15:00:35

Спасибо за исправление свойства mainEntityOfPage.

И отличная находка насчёт тега meta против тега link
~~<link itemprop='url' content='<%= @topic_view.absolute_url %>'>~~

Ещё лучше:
<link itemprop='url' href='<%= @topic_view.absolute_url %>'>

Смотрите:
– Эта ссылка устарела, но YouTube до сих пор использует <link itemprop='url' href='…'>. –

“[Для] предоставления URL в HTML5 […] [для тега link] используйте атрибут href”
“Если вы используете URL в качестве значения атрибута content элемента meta, он будет представлять строку (выглядящую как URL), а не URL.”

Я только что перепроверил документацию Google на странице DiscussionForumPosting: свойства:

Обязательные свойства:

author

author.name

datePublished

Либо text, либо image, либо video

Особое примечание: Либо text, либо image, либо video

→ “Это не обязательно, если вы представляете пост на другой странице (с внешним url), как на последующих страницах форумов или страницах категорий форума.” ←

Рекомендуемые свойства

url

[…]

Особое примечание: url

“Канонический URL обсуждения. В многостраничных темах установите это свойство в URL первой страницы. Для одного обсуждения это обычно текущий URL.”

Таким образом, я делаю вывод:

Нам не нужно снова добавлять text на page=2+ (СДЕЛАНО)
Мы должны добавить необязательное свойство url — особенно на page=2+ (СДЕЛАНО)

Необходимо дополнительное исследование:

Действительно ли эти «обязательные свойства» author, author.name и datePublished обязательны на page=2+, или мы можем обойтись без их повторения?
→ validator.schema.org не жалуется на отсутствующие свойства на page=2+. (СДЕЛАНО)
→ Подождать и проверить «Google Search Console → Отчёт: Улучшения → Форум обсуждений» на наличие новых данных после того, как уже внедрённые исправления какое-то время будут работать вживую. (TODO)

Структурированные данные: инструменты и ресурсы

Schema

`schema.org`

DiscussionForumPosting

`developers.google.com`

DiscussionForumPosting

Валидаторы

`schema.org`

Общий валидатор:
https://validator.schema.org/
Проверяет соответствие структурированных данных определениям Schema и корректность разметки с точки зрения HTML/XML.
→ Проверенные требования следуют Standard™, они довольно общие и не специфичны.
→ Я рекомендую исправлять каждую обнаруженную ошибку.

Google Search Console

Отчёт: Улучшения → Форум обсуждений:
https://search.google.com/search-console/r/discussion-forum?hl=en
Даёт прямую обратную связь по обработанной информации от Google crawler.
→ Эти отчёты в каком-то смысле являются твёрдыми фактами о SEO в Google: если Google объявляет что-то неверным, то Google считает это неверным — даже если это не так.
→ Если что-то помечено как «неверно» или «требует улучшения», я рекомендую сначала подумать над исправлением. И если нет известных побочных эффектов, то всегда внедряйте исправление.

Google: Тест расширенных результатов

https://search.google.com/test/rich-results?hl=en
Даёт только симулированную обратную связь и не является Google crawler.
Мое мнение: маркетинговый инструмент Google, чтобы сказать владельцам сайтов «Сделайте что-нибудь со своими структурированными данными!".
→ Этот инструмент в какой-то степени заброшен Google и не всегда актуален относительно последних технических рекомендаций, предоставляемых самим Google.
→ Rich Results Test не всегда выдаёт тот же результат, что и Google Search Console — в случае сомнений: лучше доверять Google Search Console.

rrlevering · 02.Январь.2024 21:02:51

Давайте составим псевдокод для текущей проверки, отображаемой в Search Console. Я думаю, это сильно поможет в этих обсуждениях. Я мог бы отправить вам спецификации ShEx или SHACL, но они гораздо менее читаемы для человека.

    if not (IsDeletedContent() OR IsExternalContent())
       then if not ("text" OR "articleBody" OR "sharedContent" OR "image" or "video")
         then report(OneOfThreeRequired("text", "image", "video"))
    if not ("author")
       then Report(Required("author"))
    if not("datePublished")
       then Report(Required("datePublished")

Суть в следующем: если у записи DiscussionForumPosting (или первого сообщения темы) контент находится на текущей странице, то должно присутствовать какое-либо поле с контентом.

Если DiscussionForumPosting ссылается на контент на другой странице (например, на исходной странице многостраничного материала), то может быть достаточно заглушки, содержащей любую информацию (например, заголовок темы первого сообщения), с последующей ссылкой на URL первой страницы. Именно это проверяет функция IsExternalContent(), которая просто сверяет, что URL не совпадает с URL текущей страницы.

Второй пример в нашей документации должен был в точности моделировать этот случай (14-я страница ссылается на заглушку поста с первой страницы).

Поля author и date в наших правилах валидации в настоящее время обязательны в любом случае. Это сделано в основном для того, чтобы избежать лишнего перехода для поиска этих данных. Вы могли бы хотя бы видеть, как знание даты первого сообщения помогает понять, насколько устарел комментарий. Не могли бы вы просто добавить туда мета-элементы с этими данными? Я не слишком беспокоился по поводу этих полей в контексте раздувания страницы избыточными данными.

techAPJ · 03.Январь.2024 14:15:54

Спасибо за контекст и советы, Райан!

Это сделано. Метаданные для последующих страниц (со второй и далее) теперь выглядят хорошо!

Falco · 03.Январь.2024 14:41:40

Имеет ли смысл добавлять URL author, если его путь заблокирован нашим robots.txt по умолчанию? Стоит ли нам убрать эту блокировку из robots.txt, учитывая, что мы теперь продвигаем такие URL?

Тема		Ответов	Просм.
Google Structured Data -- Invalid Article Schema Support	39	9065	31.07.2018
Different schema type for Topics and Posts Feature	16	3919	01.01.2024
Google structured data for forums and profile pages Feature seo	13	1812	01.01.2024
Missing field 'text' (in 'mainEntity.suggestedAnswer') Bug	30	543	03.07.2026
Removing the /2, /3, /4, etc links for each reply within a topic URL Development seo	33	4357	13.10.2024

Улучшения схемы форума обсуждений

Технические рекомендации

Обязательные свойства:

Особое примечание: Либо `text`, либо `image`, либо `video`

Рекомендуемые свойства

Особое примечание: `url`

Структурированные данные: инструменты и ресурсы

Schema

`schema.org`

`developers.google.com`

Валидаторы

`schema.org`

Google Search Console

Google: Тест расширенных результатов

Улучшения схемы форума обсуждений

Технические рекомендации

Обязательные свойства:

Особое примечание: Либо text, либо image, либо video

Рекомендуемые свойства

Особое примечание: url

Структурированные данные: инструменты и ресурсы

Schema

schema.org

developers.google.com

Валидаторы

schema.org

Google Search Console

Google: Тест расширенных результатов

Связанные темы

Особое примечание: Либо `text`, либо `image`, либо `video`

Особое примечание: `url`

`schema.org`

`developers.google.com`

`schema.org`