Sujets dupliqués créés constamment

Bonjour,

Nous avons un problème récurrent où des sujets en double sont créés, apparemment de manière aléatoire. Nous utilisons le code d’intégration suivant sur notre site WordPress :

<script type="text/javascript">
            var discourseUrl = "https://discourse.sitename.com/",
            discourseEmbedUrl = "https://sitename.com/' . $post-category . '/' . $post-url . '";

    (function() {
      var d = document.createElement('script');
      d.type = 'text/javascript';
      d.async = true;
      d.src = DiscourseEmbed.discourseUrl + 'javascripts/embed.js';
      (document.getElementsByTagName('head')[0] || document.getElementsByTagName('body')[0]).appendChild(d);
    })();
</script>

À ma connaissance, Discourse est censé créer des sujets en fonction de l’URL canonique d’un article.

J’ai activé l’option “Embed set canonical URL”, mais il semble que nous ayons toujours des sujets en double créés. Nous les avons définis comme non répertoriés et nous les avons manuellement rendus visibles lors de la création de nouveaux sujets légitimes.

La société de développement web avec laquelle nous travaillons, depuis la migration de Drupal vers WordPress, a posé quelques questions à ce sujet :

  • Si nous ajoutions un extrait qui serait une répétition de la description méta og (donc, l’extrait spécifié des articles) à chaque page d’article et que nous encadrions cet extrait dans un sélecteur CSS personnalisé que nous fournirions à Discourse ET une balise CSS qui rendrait également cet extrait caché, Discourse parcourrait-il le code avec succès et récupérerait-il l’extrait même s’il est caché ?

  • Il semble que Discourse vérifie d’abord un flux RSS/ATOM, et j’ai vérifié qu’il y en a en fait deux : https://sitename.com/feed ET https://sitename.com/category/news/feed. Il existe également un flux pour les pages individuelles.

  • Cette URL n’est pas fournie dans le code de la page elle-même. Si nous ajoutions cette URL de flux à chaque article par programmation, pensez-vous que cela pourrait résoudre le problème ? Quel code/balise méta/sélecteur CSS spécifique doit être utilisé pour le rendre explicite pour les robots de Discourse ?

Quelqu’un aurait-il de l’expérience avec ce genre de chose ? Nous avons des sujets en double créés plusieurs fois par heure maintenant, et nous avons depuis eu recours à la mise en cache automatique de tous les sujets intégrés lors de leur création, puis à la mise en cache manuelle des sujets qui sont confirmés comme n’étant pas des doublons.

Toute aide serait grandement appréciée !