Usenet-Gruppe importieren?

Ich überlege, eine lokale Discourse-Instanz einzurichten und einige Usenet-Gruppen zu importieren, einfach um ein persönliches Archiv davon zu haben. Ich habe kein Interesse daran, einen Zwei-Wege-Spiegel zu betreiben oder auch nur unbedingt aktuelle Themen in diesen Gruppen auf dem Laufenden zu halten (obwohl ich daran interessiert wäre, wenn dies leicht umsetzbar wäre). Was ich nicht weiß, ist, wie man das macht. Es sieht so aus, als könnte ich Nachrichten aus einigen der Gruppen, die mich interessieren, über Google Groups herunterladen, allerdings ohne vollständige E-Mail-Adressen (ich bin mir nicht sicher, ob dies beim Import der Nachrichten Probleme verursachen wird) – und einige der anderen Gruppen lassen sich einfach nicht herunterladen.

Wenn ich über die Frage nachdenke, wird mir klar, dass ich Konten bei ein paar News-Servern habe. Im Prinzip sollte es mit der richtigen Software ziemlich einfach sein, alle Artikel in eine .mbox-Datei (oder eine Reihe von Dateien) herunterzuladen – aber ich bin mir nicht sicher, welche Software das wäre. Vorschläge?

Edit: Es sieht so aus, als könnte slrn (insbesondere slrnpull) den Download übernehmen, wobei es so aussieht, als wäre jeder Beitrag in einer eigenen Datei. Aber ich denke, das .mbox-Import-Skript kann damit umgehen, wenn auch mit etwas Arbeit an der Verzeichnisstruktur.

Ja, das wird ein Problem sein, da jede Nachricht einem neuen, anderen Benutzer zugewiesen wird. Deshalb erlaubt Migrate a mailing list to Discourse (mbox, Listserv, Google Groups, etc) dies standardmäßig nicht. Sie benötigen Administratorrechte in der Google-Gruppe, um die vollständigen Nachrichten einschließlich der E-Mail-Adressen herunterzuladen.

Ja, Migrate a mailing list to Discourse (mbox, Listserv, Google Groups, etc) funktioniert sowohl mit mbox-Dateien als auch mit einzelnen Nachrichten in eigenen Dateien.

Ich habe es mir schon gedacht. Es stellt sich heraus, dass slrnpull viel schneller ist als der Google Groups-Download – er verarbeitet 20–30 Nachrichten pro Sekunde, statt über eine Sekunde pro Nachricht. import_mbox.sh läuft gerade mit einigen der heruntergeladenen Daten, und bisher sieht alles gut aus.

Ja, wenn eine Gruppe über NNTP verfügbar ist, ist slrnpull höchstwahrscheinlich die bessere Alternative.