Problema de importação do phpBB

Não é incomum que nomes de arquivos duplicados existam em uploads; cada fórum precisa lidar com isso. Mas no phpBB, é possível fazer o upload de dois anexos de imagens diferentes, ambos com o mesmo nome, na mesma postagem. O phpBB gerencia isso armazenando o nome real do arquivo como “real_filename” na tabela de anexos, mas o nome com hash que ele gera como “physical_filename”.

Eu tenho 46 postagens convertidas do meu fórum phpBB que contêm imagens duplicadas, porque os nomes dos arquivos são os mesmos. Em alguns casos, é porque o usuário inadvertidamente postou o mesmo arquivo duas vezes. Mas em muitos, não é. Não tenho certeza de como o usuário fez isso - mas tenho um exemplo em que ele fez o upload de 11 imagens diferentes no phpBB, cada uma nomeada “image.jpg” (um nome de arquivo padrão ao arrastar uma imagem de um e-mail para a área de trabalho). A mesma imagem aparece 11 vezes no Discourse. Parece que o conversor identifica um anexo do phpBB para upload por real_filename - aberto a duplicatas - em vez de physical_filename.

Felizmente, eu tenho um script ruby que identifica postagens no postgres que contêm o mesmo nome de arquivo do Discourse duas vezes. Será doloroso (particularmente com a postagem com 11 duplicatas!), mas posso corrigir isso manualmente, já que meu fórum phpBB ainda existe. Mas apenas para notar como uma correção importante, já que prevejo que muitos webmasters de phpBB estarão migrando como planejo fazer.

Obrigado
Dan