Problème de rendu Markdown avec une image entourée de HTML

Ce problème est réapparu

Je réfléchis à voix haute, mais je me demande si nous ne pourrions pas contourner ce problème épineux (à savoir la conversion du HTML en Markdown). Pour résumer (juste pour aider à y réfléchir)

  1. Discourse prend en charge l’importation de HTML pour créer le contenu des publications (par exemple, le HTML provenant de WP Discourse).

  2. Dans certains contextes, l’utilisateur s’attend à ce que l’intégrité du HTML original soit préservée à l’identique.

  3. L’« intégrité » ici comprend au moins deux aspects :

    1. La manière dont le contenu est rendu, par exemple les sauts de ligne.
    2. L’emplacement où les médias sont hébergés, par exemple le téléchargement des images en local pour éviter les images brisées, ou potentiellement pour des raisons de sécurité.
  4. La conversion du HTML en Markdown peut créer des problèmes pour le premier type d’intégrité, mais elle est actuellement nécessaire pour garantir le second type d’intégrité.

Ainsi, une façon possible de résoudre ce problème pour certaines publications importées serait de stocker directement le HTML importé comme contenu « cuit » de la publication, et le job pull_hotlinked_images prendrait en charge le téléchargement des images dans un tel contenu sans convertir les balises img en Markdown.

Oui, pour le dire plus simplement, le code pourrait peut-être prendre en charge le téléchargement des images liées sans exiger la conversion des balises img en Markdown. Pour de telles publications, vous interpoleriez l’URL de l’image téléchargée dans le contenu cuit plutôt que dans le contenu brut.

3 « J'aime »