Temas duplicados creados constantemente

Hola,

Hemos tenido un problema recurrente en el que se crean temas duplicados, aparentemente al azar. Estamos utilizando el siguiente código de inserción en nuestro sitio web de WordPress:

<script type="text/javascript">
            var discourseUrl = "https://discourse.sitename.com/",
            discourseEmbedUrl = "https://sitename.com/' . $post-category . '/' . $post-url . '";

    (function() {
      var d = document.createElement('script');
      d.type = 'text/javascript';
      d.async = true;
      d.src = DiscourseEmbed.discourseUrl + 'javascripts/embed.js';
      (document.getElementsByTagName('head')[0] || document.getElementsByTagName('body')[0]).appendChild(d);
    })();
</script>

Hasta donde sé, Discourse debería crear temas basándose en la URL canónica de una publicación.

Habilité la opción “Embed set canonical URL” (Insertar URL canónica), pero parece que todavía se están creando temas duplicados. Los hemos configurado como no listados y hemos estado desocultando manualmente la creación de nuevos temas legítimos.

La empresa de desarrollo web con la que estamos trabajando, desde que migró de Drupal a WordPress, ha hecho algunas preguntas al respecto:

  • Si añadiéramos un extracto que fuera una repetición de la descripción meta og: (es decir, el extracto especificado de los artículos) a cada página de artículo y envolviéramos ese extracto en un selector CSS personalizado que proporcionaríamos a Discourse Y una etiqueta CSS que también haría que este extracto estuviera oculto, ¿rastrearía Discourse el código correctamente y captaría el extracto incluso estando oculto?

  • Parece que Discourse primero busca un feed RSS/ATOM, y he verificado que en realidad hay dos: https://sitename.com/feed Y https://sitename.com/category/news/feed. También hay un feed para páginas individuales.

  • Sin embargo, esta URL no se proporciona en el código de la página en sí. Si añadiéramos esta URL de feed a cada publicación mediante programación, ¿crees que esto podría resolver el problema? ¿Qué código/etiqueta meta/selector CSS específico se debería usar para que esto sea explícito para los rastreadores de Discourse?

¿Alguien tendría experiencia con este tipo de cosas? Hemos estado recibiendo temas duplicados creados varias veces por hora y desde entonces hemos recurrido a ocultar automáticamente todos los temas incrustados al crearlos, y luego desocultar manualmente los temas que se confirma que no son duplicados.

¡Cualquier ayuda sería muy apreciada!