No es raro que existan nombres de archivo duplicados en las subidas; cada foro debe tener esto en cuenta. Pero en phpBB, es posible subir dos archivos adjuntos de diferentes imágenes, ambos con el mismo nombre, en la misma publicación. phpBB gestiona esto almacenando el nombre real del archivo como “real_filename” en la tabla de archivos adjuntos, pero el nombre con hash que genera como “physical_filename”.
Tengo 46 publicaciones convertidas de mi foro phpBB que contienen imágenes duplicadas, porque los nombres de archivo son los mismos. En algunos casos, se debe a que el usuario publicó inadvertidamente el mismo archivo dos veces. Pero en muchos casos, no es así. No estoy seguro de cómo lo hizo el usuario, pero tengo un ejemplo en el que subió 11 imágenes diferentes en phpBB, cada una llamada “image.jpg” (un nombre de archivo predeterminado al arrastrar una imagen de un correo electrónico al escritorio). La misma imagen aparece 11 veces en Discourse. Parece que el conversor identifica un archivo adjunto de phpBB para subir por real_filename, abierto a duplicados, en lugar de physical_filename.
Afortunadamente, tengo un script de ruby que identifica las publicaciones en postgres que contienen el mismo nombre de archivo de Discourse dos veces. Será doloroso (¡particularmente con la publicación con 11 duplicados!), pero puedo solucionarlo manualmente ya que mi foro phpBB todavía existe. Pero solo para señalarlo como una corrección importante, ya que anticipo que muchos administradores de foros phpBB harán lo mismo que yo planeo hacer.
Gracias
Dan