Ständig werden doppelte Themen erstellt

Hallo,
Wir hatten ein wiederkehrendes Problem, bei dem scheinbar zufällig doppelte Themen erstellt wurden. Wir verwenden den folgenden Einbettungscode auf unserer WordPress-Website:

<script type="text/javascript">
            var discourseUrl = "https://discourse.sitename.com/",
            discourseEmbedUrl = "https://sitename.com/' . $post-category . '/' . $post-url . '";

    (function() {
      var d = document.createElement('script');
      d.type = 'text/javascript';
      d.async = true;
      d.src = DiscourseEmbed.discourseUrl + 'javascripts/embed.js';
      (document.getElementsByTagName('head')[0] || document.getElementsByTagName('body')[0]).appendChild(d);
    })();
</script>

Soweit ich weiß, soll Discourse Themen basierend auf der kanonischen URL eines Beitrags erstellen.

Ich habe die Option “Embed set canonical URL” aktiviert, aber es scheint, dass immer noch doppelte Themen erstellt werden. Wir haben sie als nicht gelistet markiert und manuell ausgeblendet, wenn neue legitime Themen erstellt wurden.

Das Webentwicklungsunternehmen, mit dem wir zusammenarbeiten, hat seit der Migration von Drupal zu WordPress einige Fragen dazu gestellt:

  • Wenn wir einen Auszug hinzufügen würden, der eine Wiederholung der og:meta-Beschreibung ist (also der angegebene Auszug der Artikel) zu jeder Artikelseite und diesen Auszug in einen benutzerdefinierten CSS-Selektor einpacken würden, den wir Discourse zur Verfügung stellen würden UND ein CSS-Tag, das diesen Auszug ebenfalls versteckt, würde Discourse den Code erfolgreich crawlen und den Auszug abrufen, auch wenn er versteckt ist?

  • Es sieht so aus, als ob Discourse zuerst nach einem RSS/ATOM-Feed sucht, und ich habe bestätigt, dass es tatsächlich zwei davon gibt: https://sitename.com/feed UND https://sitename.com/category/news/feed. Es gibt auch einen Feed für einzelne Seiten.

  • Diese URL ist jedoch nicht im Code der Seite selbst angegeben. Wenn wir diese Feed-URL programmatisch zu jedem Beitrag hinzufügen würden, glauben Sie, dass dies das Problem lösen könnte? Welcher spezifische Code/Meta-Tag/CSS-Selektor sollte verwendet werden, um dies für Discourse-Scraper explizit zu machen?

Hat jemand Erfahrung mit so etwas? Wir erhalten jetzt mehrmals pro Stunde doppelte Themen, und wir haben uns damit begnügt, jedes eingebettete Thema nach der Erstellung automatisch auszublenden und dann manuell Themen auszublenden, die bestätigt keine Duplikate sind.

Jede Hilfe wäre sehr willkommen!