QA/solved + DFP/core 之间的 schema.org 标记对齐

我从阅读其他帖子中了解到,QAPage 的 schema.org 标记是由 discourse-solved 插件生成的。例如,我阅读了 https://meta.discourse.org/t/wrong-answercount-value-from-discourse-solved/108845/6,其中讨论了将更通用的论坛符合问答模型的问题。

对于消费者(包括我和 Google)来说,这与主论坛生成的 DFP 标记有些重复。事实上,它们目前都被标记为页面的主要实体。令人恼火的是,它们的内容也不完全重叠,这导致一些简单的去重失败。例如:

  • 问题/答案标记的作者使用人类可读的名称,没有 URL,但 DFP 的作者使用句柄 + URL。这使得作者看起来非常不同。
  • 问题/答案标记的内容被截断,但 DFP 的内容因为是微数据所以是完整的。
  • 正如在上述帖子中所讨论的,答案计数是“捏造”的。
  • Question 中使用了 dateCreated,而 DFP 中使用了 datePublished。

标题和日期似乎是一致的,但有时我们的去重逻辑在全局实现时需要更多信息。

作为最低限度的改进,无需进行重大更改,您是否认为可以统一作者信息,以便两者都包含句柄、名称(您可以使用 alternateName - Schema.org Property 进行区分)以及两个位置的个人资料 URL?

7 个赞

感谢您提出这个问题!我们将在下个月安排专人进行查看。

3 个赞

上述问题已通过以下方式修复:

2 个赞

很棒@rrlevering,你觉得我们现在可以关闭这个请求了吗?\n\n我将设置一个计时器,在几天后关闭它。

2 个赞

感谢您的修复。我认为标记(主要来自作者信息)已经足够对齐,我们现在可以使用作者和时间戳的某种组合在我们的系统上进行重复数据删除。告知您我的计划,我将基本上将额外的“问题”类型合并到“讨论论坛帖子”中,并将“答案”类型合并到我们系统上的“评论”中。

最终,建议您找到一种方法来解决这个问题。要么将其直接集成到 Discourse 中,以便在标记中进行原生类型选择,以在 DFP 或问题之间进行选择,要么使用节点 ID 将额外类型附加到核心论坛平台生成的标记上(这样 OP 将被共同标记为问题 + 讨论论坛帖子)。它最终可能会被我们的系统禁止,或者至少在报告中被标记为无效,但我理解目前在摸索这个领域时,这有一些实际原因。

2 个赞

此主题已在 3 天后自动关闭。不再允许回复。