Necesito tu ayuda con un problema. Tenemos muchos temas almacenados como HTML en la base de datos (raw_data), pero es un HTML que fue “migrado” desde otro sistema. Esto se hizo antes de que lanzáramos el sitio web y nunca, bajo ninguna circunstancia, lo habríamos hecho de esta manera. Lo que queremos lograr es convertir la cadena HTML que contiene <div>, <link>, <br />, <span>, <blockquote>, <small> (pero no <p>) y algo que no es HTML como [quote][/quote] en Markdown y luego rehacer las publicaciones para obtenerlas en el estilo HTML de Discourse, de modo que sean optimizadas por Discourse (por ejemplo, vista de rastreador). En este momento, se utiliza el contenido HTML antiguo y plano (cooked_method=2), lo que genera muchos problemas de rastreo y errores soft404 en Google Search Console.
Debemos hacer esto para aproximadamente 4-5 millones de publicaciones, por lo que será un trabajo muy costoso.
¿Alguna idea?
Saludos,
Mike