Importer un groupe Usenet ?

J’envisage de configurer une instance Discourse locale et d’y importer certains groupes Usenet, simplement pour constituer une archive personnelle de ceux-ci. Je ne suis pas intéressé par la mise en place d’un miroir bidirectionnel, ni même nécessairement par le fait de suivre les sujets actuels de ces groupes (bien que si cela pouvait être réalisé facilement, cela m’intéresserait). Ce dont je ne suis pas sûr, c’est de la manière de procéder. Il semble que je puisse télécharger des messages de certains groupes qui m’intéressent via Google Groups, bien qu’ils ne contiendront pas les adresses e-mail complètes (je ne sais pas si cela posera des problèmes lors de l’importation des messages) – et certains autres groupes ne sont tout simplement pas téléchargeables.

En réfléchissant à la question, je réalise que j’ai des comptes sur quelques serveurs de news. En principe, il semble que ce soit assez simple, avec le bon logiciel, de télécharger tous les articles dans un fichier .mbox (ou une série de fichiers) – mais je ne sais pas quel serait ce logiciel. Des suggestions ?

Édition : Il semble que slrn (plus précisément slrnpull) puisse gérer le téléchargement, bien qu’il semble que chaque message soit dans son propre fichier. Mais je pense que le script d’importation .mbox peut s’en charger, moyennant un peu de travail sur la structure des répertoires.

Oui, cela va poser problème, car chaque message sera attribué à un nouvel utilisateur différent. C’est pourquoi Migrate a mailing list to Discourse (mbox, Listserv, Google Groups, etc) ne le permet pas par défaut. Vous devez avoir les droits d’administrateur sur le groupe Google pour télécharger les messages complets, y compris les adresses e-mail.

Oui, Migrate a mailing list to Discourse (mbox, Listserv, Google Groups, etc) fonctionne aussi bien avec les fichiers mbox qu’avec chaque message dans son propre fichier.

2 « J'aime »

Je m’en doutais. Il s’avère que slrnpull est beaucoup plus rapide que le téléchargement de Google Groups : il traite 20 à 30 messages par seconde, au lieu d’une seconde par message. import_mbox.sh est en cours d’exécution sur certaines données téléchargées, et jusqu’à présent, tout semble bien se passer.

1 « J'aime »

Oui, si un groupe est disponible via NNTP, alors slrnpull est très probablement la meilleure alternative.

1 « J'aime »