发布完整帖子内容:在 Discourse 中将 HTML 转换为 Markdown

我在 WordPress 中有一个知识库文章类型,希望将所有这些文章迁移到 Discourse,以便与 Discourse Docs 和论坛功能配合使用。

在我看来,最简单的方法是使用 WP Discourse 插件在 Discourse 中自动创建主题。但是,当我这样做时,主题内容全是 HTML 格式,这使得后续编辑变得非常困难。

是否可以让该插件将所有 HTML 转换为 Markdown?或者是否有更好的方法?

一个相关的问题:WP 文章中的任何图片都会创建指向 WordPress 站点上文件的链接。如果我删除文章和媒体库文件,这些链接就会失效。是否有可能完整导入这些图片,就像它们直接被插入到 Discourse 中一样?

最后,是否有一种自动化机制可以同步/发布已存在的文章?我不想手动逐个打开它们。

(我注意到,如果启用了“强制发布”,我只需批量选择所有文章,进行批量编辑,并将文章状态更新为“发布”。这不会改变任何内容,但会触发同步。)

2 个赞

WP Discourse 插件并非设计用于处理数据迁移。您会遇到各种问题,包括您提到的 HTML 到 Markdown 的转换问题。

您需要通过后端数据迁移来完成此操作。如果您托管在 Discourse.org,他们可以作为 托管套餐 的一部分为您处理此事。

如果您是自己托管,并且有兴趣,可以亲自尝试。Discourse 提供了一些现成的迁移脚本可供使用。如果您选择这条路径并需要帮助,请在 Dev 频道发帖,我会为您提供一些建议。

或者,您也可以雇佣 Marketplace 中的人员为您完成此项工作。

1 个赞

非常感谢快速回复!

这很有道理。我将在 Dev 频道发帖,了解更多关于 WordPress 迁移脚本的信息。

1 个赞

供未来参考,我最终采用的是半自动化流程。

我逐一打开了每篇帖子(大约 120 篇),发布到 Discourse,然后使用这个 Chrome 扩展程序将内容转换为 Markdown。

MarkDownload - Markdown Web Clipper - Chrome Web Store (google.com)

随后,我直接复制该 Markdown 输出,在 Discourse 中编辑主题,并用 Markdown 替换摘要。我需要在 Markdown 配置中调整几项设置,但除此之外效果完美,仅有一些代码块需要处理,并且需要更新所有内部链接的 URL。此外,我还必须将媒体文件保留在 WordPress 媒体库中,因为所有图片链接都指向那里。

该方法之所以有效,主要是因为这些帖子是使用经典编辑器创建的。如果将它们转换为区块模式,生成的 Markdown 质量会差很多。不过,我想我也可以从前台复制内容,但直接从“编辑帖子”页面复制的效果更好。

1 个赞

This topic was automatically closed 30 days after the last reply. New replies are no longer allowed.