angus
(Angus McLeod)
25
这个问题又出现了
只是随口说说,我在想我们是否能绕过这个棘手的问题(即 HTML 到 Markdown 的转换)。再回顾一下(仅为了帮助理清思路):
-
Discourse 支持导入 HTML 以创建帖子内容(例如来自 WP Discourse 的 HTML)。
-
在某些上下文中,用户期望原始 HTML 的完整性被完全保留。
-
此处的“完整性”至少包含两个方面:
- 内容的渲染方式,例如换行符
- 媒体资源的托管位置,例如将图片下载到本地以避免图片链接失效,或出于安全考虑
-
HTML 到 Markdown 的转换可能会影响第一种完整性,但目前为了保障第二种完整性,这种转换是必要的。
因此,针对某些导入的帖子,一种可能的解决方案是直接将导入的 HTML 存储为已渲染的帖子内容,同时让 pull_hotlinked_images 作业支持下载此类内容中的图片,而无需将 img 标签转换为 Markdown。
是的,更简单地说,代码或许可以支持下载热链接图片,而无需将 img 标签转换为 Markdown。对于此类帖子,你将在已渲染的内容中插入下载后的图片 URL,而不是原始 URL(而非原始 HTML 中的 URL)参考此处。
3 个赞