Il n’est pas rare que des noms de fichiers dupliqués existent dans les téléchargements ; chaque forum doit en tenir compte. Mais dans phpBB, il est possible de télécharger deux pièces jointes de différentes images, toutes deux portant le même nom, dans le même message. phpBB gère cela en stockant le nom de fichier réel comme « real_filename » dans la table des pièces jointes, mais le nom haché qu’il génère comme « physical_filename ».
J’ai 46 messages convertis de mon forum phpBB qui contiennent des images dupliquées, car les noms de fichiers sont identiques. Dans quelques cas, c’est parce que l’utilisateur a inadvertamment posté le même fichier deux fois. Mais dans de nombreux cas, ce n’est pas le cas. Je ne sais pas comment l’utilisateur a fait - mais j’ai un exemple où il a téléchargé 11 images différentes dans phpBB, chacune nommée « image.jpg » (un nom de fichier par défaut lors du glisser-déposer d’une image d’un e-mail sur le bureau). La même image apparaît 11 fois dans Discourse. Il semble que le convertisseur identifie une pièce jointe phpBB à télécharger par real_filename - ouvert aux doublons - plutôt que par physical_filename.
Heureusement, j’ai un script ruby qui identifie les messages dans postgres contenant deux fois le même nom de fichier Discourse. Ce sera douloureux (surtout avec le message contenant 11 doublons !), mais je peux le corriger manuellement puisque mon forum phpBB existe toujours. Mais juste pour noter comme correction importante, car j’anticipe que de nombreux webmestres phpBB vont migrer comme je prévois de le faire.
Merci
Dan