Erreur dans les données Schema.org pour DiscussionForumPosting ?

j127 · Mars 24, 2023, 6:58

J’ai remarqué un bug dans les données Schema.org pour DiscussionForumPosting.

Lorsque j’exécute un sujet de forum Discourse aléatoire via le validateur, il affiche le champ @id avec des URL qui n’existent pas.

Voici un exemple avec un chemin final de /post_2 (c’est une erreur 404) :

Je pense que ces champs @id sont censés être des URL valides, car W3.org dit :

Pour pouvoir référencer des nœuds externes dans un graphe, il est important que les nœuds aient un identifiant. Les IRI sont un concept fondamental des Linked Data, pour que les nœuds soient réellement liés, le déréférencement de l’identifiant devrait aboutir à une représentation de ce nœud. Cela peut permettre à une application de récupérer des informations supplémentaires sur un nœud.

awesomerobot · Mars 28, 2023, 10:15

Je me demande si c’est un problème avec la façon dont le validateur affiche l’id. D’après ce que je peux dire, l’id est extrait du balisage et n’est pas quelque chose que nous définissons nous-mêmes, par exemple :

<div> id='post_1' itemscope itemtype='http://schema.org/DiscussionForumPosting' class='topic-body crawler-post'>

id='post_1 étant le @id

Si vous cliquez sur cette section d’id dans le validateur, elle met correctement en surbrillance la publication avec l’id correspondant… donc il semble que le validateur puisse l’identifier correctement.

Je remarque ce comportement sur d’autres sites avec des valeurs @id, par exemple dans les données de schéma de cette question stackoverflow.com :

Screenshot 2023-03-28 at 5.59.12 PM

Cela présente le même problème, https://stackoverflow.com/questions/7227202/answer-38775925 n’est pas une URL valide, elle souffre de la même erreur où il devrait y avoir un # au lieu d’un / https://stackoverflow.com/questions/7227202#answer-38775925.

Y a-t-il des indications que cela cause un problème avec la façon dont ces données sont utilisées en pratique quelque part ?

j127 · Mars 29, 2023, 3:28

C’est intéressant. Je n’avais pas pensé à vérifier le code source HTML et j’avais juste supposé que c’était du JSON-LD.

Google utilise des données de schéma, mais je ne suis pas sûr s’ils utilisent celui-ci en particulier. La documentation de schema.org n’est pas très claire.

Il semble que Discourse place plusieurs DiscussionForumPosting sur chaque sujet, mais l’exemple dans la documentation ressemble à DiscussionForumPosting pourrait être destiné à se référer uniquement au sujet principal et non aux commentaires ? La documentation liste un champ comment avec un Comment (singulier) bien que la description soit formulée au pluriel.

Je viens de regarder comment Invison le fait et il utilise du JSON-LD, plaçant des objets Comment dans un champ comment. Il semble que ce soit beaucoup de texte supplémentaire à envoyer au navigateur.

Je ne connais pas la réponse, mais j’essaierai de faire plus de recherches plus tard.

JammyDodger · Mars 29, 2023, 7:25

Est-ce pertinent ?

rrlevering · Mars 29, 2023, 12:09

Je traîne sur ce forum, ce qui est pratique. Je possède le code Google qui analyse cela.

Le fil de discussion lié est une bonne réponse à la digression du commentaire. Je vais aborder le reste ici.

Il est essentiellement non standard d’interpréter les attributs d’ID HTML comme des ID de nœuds. Cela a été fait dès le début de l’analyse du microdonnées par Google, probablement pour des raisons floues. Vous êtes censé utiliser itemid si vous voulez le faire explicitement. J’espère supprimer ce hack un jour, mais il est difficile de retirer quelque chose comme ça sans pertes.

Deuxièmement, les IRI ne doivent pas nécessairement être résolubles. C’est une suggestion du W3C, mais de nombreux IRI ne le sont pas et Google ne l’exige certainement pas.

Ce n’est un problème que si cela provoque la fusion involontaire de nœuds dans les données structurées, comme si vous utilisiez un itemid de la même valeur ailleurs dans le HTML. Sinon, c’est juste une bizarrerie qui peut être ignorée.

Oh, et s’il vous plaît, ne passez pas à JSON-LD. Honnêtement, c’est préférable pour le balisage riche en texte comme les forums. Avoir à dupliquer le contenu textuel est idiot. C’est juste plus facile à écrire, c’est pourquoi nous le poussons.

awesomerobot · Mars 29, 2023, 1:01

Merci d’avoir regardé @rrlevering ! Il semble qu’il soit sûr de clore ce problème, et nous mettrons à jour le schéma des sujets/publications dans Different schema type for Topics and Posts

awesomerobot · Avril 1, 2023, 12:00

Ce sujet a été automatiquement fermé après 2 jours. Les nouvelles réponses ne sont plus autorisées.

Sujet		Réponses	Vues
Discussion Forum Schema improvements Support	34	3476	Janvier 23, 2025
Different schema type for Topics and Posts Feature	16	3806	Janvier 1, 2024
Google Structured Data -- Invalid Article Schema Support	44	8732	Novembre 9, 2018
Posts structured data: set explicit "identifier" and canonical url as "url" Dev	0	490	Mars 20, 2022
Google structured data for forums and profile pages Feature seo	14	1626	Janvier 1, 2024

Erreur dans les données Schema.org pour DiscussionForumPosting ?

Sujets connexes