アップロードでファイル名が重複することは珍しくなく、すべての掲示板でそれを考慮する必要があります。しかし、phpBBでは、同じ投稿内で、名前が同じで異なる画像である2つの添付ファイルをアップロードすることが可能です。phpBBは、添付テーブルに実際のファイル名を「real_filename」として保存し、生成されるハッシュ名を「physical_filename」として保存することで、これを管理しています。
ファイル名が同じであるため、重複する画像を含む46件の投稿をphpBBから変換しました。数例では、ユーザーが意図せず同じファイルを2回投稿したことが原因です。しかし、多くの場合そうではありません。ユーザーがどのようにそれを実行したのかは不明ですが、ユーザーが「image.jpg」(メールからデスクトップに画像をドラッグしたときのデフォルトのファイル名)という名前の11枚の異なる画像をphpBBにアップロードした例があります。同じ画像がDiscourseに11回表示されます。コンバーターは、phpBBの添付ファイルを、重複を受け入れる「real_filename」によって識別しており、「physical_filename」によって識別していないようです。
幸いなことに、postgres内のDiscourseの同じファイル名を2回含む投稿を特定するRubyスクリプトを持っています。手動で修正するのは大変ですが(特に11個の重複がある投稿では!)、phpBB掲示板がまだ存在するため、手動で修正できます。しかし、私が計画しているように多くのphpBBウェブマスターが移行することを予想しているので、重要な修正点として指摘しておきます。
Danより、ありがとうございます。