Este problema ha vuelto a aparecer
Solo estoy pensando en voz alta, pero me pregunto si podríamos omitir el problema complicado aquí (es decir, la conversión de HTML a Markdown). Para recapitular (solo para ayudar a reflexionar sobre esto):
-
Discourse admite la importación de HTML para la creación de contenido de publicaciones (por ejemplo, HTML de WP Discourse).
-
En algunos contextos, el usuario espera que la integridad del HTML original se conserve exactamente.
-
La “integridad” aquí tiene al menos dos aspectos:
- Cómo se representa el contenido, por ejemplo, los saltos de línea.
- Dónde se alojan los medios, por ejemplo, descargar imágenes a local para evitar imágenes rotas o, potencialmente, por preocupaciones de seguridad.
-
La conversión de HTML a Markdown puede generar problemas para el primer tipo de integridad; sin embargo, actualmente es necesaria para garantizar el segundo tipo de integridad.
Por lo tanto, tal vez una forma de abordar este problema para ciertas publicaciones importadas sería almacenar el HTML importado directamente como el contenido cocinado de la publicación, y el trabajo pull_hotlinked_images podría admitir la descarga de imágenes en dicho contenido sin convertir las etiquetas img a Markdown.
Sí, dicho más simplemente, quizás el código podría admitir la descarga de imágenes con enlaces externos sin requerir la conversión de img a Markdown. Para esas publicaciones, se podría interpolare la URL de la imagen descargada en el contenido cocinado en lugar de en el contenido sin procesar.