Bonjour,
Lorsque Google Yahoo a été abandonné, les administrateurs d’un groupe existant ont exporté tous les messages au format HTML. Ils ont ensuite téléchargé tous les fichiers HTML sur Groups.io, et ce fut leur processus de migration.
Aujourd’hui, il existe quelques centaines de ces fichiers HTML avec des titres tels que HtmlDigest001 contenant des centaines de sujets différents par fichier, et chaque sujet a des dizaines de messages.
J’ai essayé avec des scripts Python d’extraire le texte organisé par sujet et date de publication dans des documents Word individuels, mais sans succès.
Je me demandais maintenant si Discourse serait capable d’importer ces fichiers HTML et de les convertir d’une manière ou d’une autre en messages distincts. Ou s’il existe un outil capable d’accomplir cette tâche.
Merci de votre temps et de votre aide.
Cordialement