将 HTML 导入 Discourse

您好:

当 Google Yahoo 关闭时,现有群组的管理员将所有消息导出为 HTML。然后,他们将所有 HTML 上传到 Groups.io,这就是他们的迁移过程。

今天有几百个这样的 HTML 文件,标题如 HtmlDigest001,每个文件包含数百个不同的主题,每个主题又有几十条消息。

我一直在用 Python 脚本尝试按主题和发布日期整理文本并将其提取到单独的 Word 文档中,但都没有成功。

我现在在想 Discourse 是否能够导入这些 HTML 文件并以某种方式将它们转换为单独的消息。或者是否有能够完成此任务的工具。

感谢您的时间和帮助。

此致

嗯,一切皆有可能。你需要编写一些东西来解析它们,比如将它们推送到数据库。你可以看看 json 或 csv 导入器。nokogiri gem 可以提供帮助。

2 个赞