Согласование разметки schema.org между QA/решенными и DFP/основными

Судя по прочтению других постов, разметка schema.org для QAPage генерируется плагином discourse-solved. Я читал, например, обсуждение на Wrong answerCount value from discourse-solved - #6 by sam, где рассматриваются проблемы приведения более общего форума к модели «вопрос-ответ».

Для потребителей (включая меня и Google) это выглядит как дублирующаяся разметка по сравнению с DFP, которая генерируется основным форумом. Более того, в настоящее время оба источника помечены как основные сущности страницы. Раздражает ещё и то, что их содержимое не полностью совпадает, из-за чего некоторые наивные алгоритмы дедупликации не работают. Например:

  • автор в разметке «Вопрос/Ответ» использует читаемое человеком имя без URL, тогда как автор в DFP использует никнейм + URL. Из-за этого авторы выглядят совершенно по-разному.
  • содержимое в разметке «Вопрос/Ответ» обрезано, тогда как в DFP, поскольку это микроданные, оно присутствует полностью.
  • Как обсуждалось в упомянутом посте, количество ответов в некоторой степени сфабриковано.
  • в «Вопросе» используется поле dateCreated, а в DFP — datePublished.

Заголовок и дата, похоже, согласованы, но иногда нашей логике дедупликации требуется больше информации, особенно при глобальной реализации.

В качестве минимального улучшения без серьёзных изменений: не могли бы вы согласовать информацию об авторе так, чтобы в обоих случаях присутствовали никнейм, имя (можно использовать alternateName - Schema.org Property для различения) и URL профиля?

7 лайков

Спасибо, что подняли этот вопрос! Мы убедимся, что кто-то ознакомится с этим в течение следующего месяца.

3 лайка

Вышеуказанные проблемы были исправлены в:

2 лайка

Потрясающе, @rrlevering! Считаете ли вы, что мы достигли достаточного прогресса, чтобы закрыть эту задачу сейчас?

Я поставлю таймер, чтобы закрыть её через несколько дней.

2 лайка

Спасибо за исправления. Я считаю, что разметка достаточно согласована (в основном благодаря информации об авторе), поэтому мы теперь можем выполнять дублирование на нашей стороне, используя комбинацию автора и временной метки. Чтобы вы знали о моих планах, я собираюсь по сути объединить дополнительный тип Question с DiscussionForumPosting, а тип Answer — с Comment на нашей стороне.

Будет целесообразно в конечном итоге найти способ реализовать это на вашей стороне. Либо интегрировать это напрямую в Discourse для нативной типизации в разметке, чтобы выбирать между DFP или Question, либо использовать идентификаторы узлов для добавления дополнительного типа в разметку, генерируемую основной платформой форума (таким образом, OP будет иметь двойную типизацию: Question + DiscussionForumPosting). Вероятно, в будущем это будет запрещено или хотя бы помечено как недействительное в отчетах наших систем, но я понимаю некоторые практические причины, по которым это необходимо в настоящее время, поскольку мы ещё изучаем эту область.

2 лайка

Эта тема была автоматически закрыта через 3 дня. Новые ответы больше не принимаются.