您好:
当 Google Yahoo 关闭时,现有群组的管理员将所有消息导出为 HTML。然后,他们将所有 HTML 上传到 Groups.io,这就是他们的迁移过程。
今天有几百个这样的 HTML 文件,标题如 HtmlDigest001,每个文件包含数百个不同的主题,每个主题又有几十条消息。
我一直在用 Python 脚本尝试按主题和发布日期整理文本并将其提取到单独的 Word 文档中,但都没有成功。
我现在在想 Discourse 是否能够导入这些 HTML 文件并以某种方式将它们转换为单独的消息。或者是否有能够完成此任务的工具。
感谢您的时间和帮助。
此致