phpBB 导入问题

在上传中出现重复文件名并不少见;每个论坛都必须考虑到这一点。但在 phpBB 中,有可能在同一个帖子中上传两个具有相同名称但不同图片的附件。phpBB 通过将实际文件名存储为附件表中的“real_filename”,而将生成的哈希名称存储为“physical_filename”来管理这种情况。

我有 46 个从我的 phpBB 论坛转换而来的帖子,其中包含重复的图片,因为它们的文件名相同。在少数情况下,这是因为用户无意中上传了两次相同的文件。但在很多情况下并非如此。我不确定用户是如何做到的——但我有一个例子,他们上传了 11 张不同的图片到 phpBB,每张都命名为“image.jpg”(从电子邮件拖动图片到桌面上时的默认文件名)。在 Discourse 中,同一张图片出现了 11 次。看来转换器是通过 real_filename(允许重复)来识别要上传的 phpBB 附件,而不是通过 physical_filename。

幸运的是,我有一个 ruby 脚本可以识别出在 postgres 中包含两次相同 Discourse 文件名的帖子。手动修复会很痛苦(特别是对于包含 11 个重复项的帖子!),但由于我的 phpBB 论坛仍然存在,我可以手动修复。但仅供参考,这是一个重要的更正,因为我预计许多 phpBB 网站管理员会像我计划的那样迁移过来。

谢谢
Dan