Es ist nicht ungewöhnlich, dass doppelte Dateinamen in Uploads vorkommen; jedes Board muss damit umgehen können. Aber in phpBB ist es möglich, zwei Anhänge unterschiedlicher Bilder, beide mit demselben Namen, in demselben Beitrag hochzuladen. phpBB verwaltet dies, indem es den tatsächlichen Dateinamen als „real_filename“ in der Anhangstabelle speichert, aber den generierten Hash-Namen als „physical_filename“.
Ich habe 46 Beiträge von meinem phpBB-Forum konvertiert, die doppelte Bilder enthalten, weil die Dateinamen gleich sind. In einigen Fällen liegt es daran, dass der Benutzer versehentlich dieselbe Datei zweimal gepostet hat. Aber in vielen Fällen ist das nicht so. Ich bin mir nicht sicher, wie der Benutzer es gemacht hat – aber ich habe ein Beispiel, bei dem er 11 verschiedene Bilder in phpBB hochgeladen hat, jedes benannt als „image.jpg“ (ein Standarddateiname beim Ziehen eines Bildes aus einer E-Mail auf den Desktop). Dasselbe Bild erscheint 11 Mal in Discourse. Es scheint, dass der Konverter einen phpBB-Anhang zum Hochladen anhand von real_filename identifiziert – anfällig für Duplikate – anstatt anhand von physical_filename.
Glücklicherweise habe ich ein Ruby-Skript, das Beiträge in PostgreSQL identifiziert, die denselben Discourse-Dateinamen zweimal enthalten. Es wird mühsam sein (insbesondere bei dem Beitrag mit 11 Duplikaten!), aber ich kann dies manuell beheben, da mein phpBB-Board noch existiert. Aber nur als wichtige Korrektur, da ich erwarte, dass viele phpBB-Webmaster, so wie ich es vorhabe, umsteigen werden.
Danke
Dan