Das ist absolut lohnenswert. Ich bin allerdings voreingenommen: Ich habe vor ein paar Jahren als Hobbyprojekt an etwas Ähnlichem gearbeitet.
Das Ziel war nicht nur, eine Jekyll-Site aus kuratierten Inhalten in Discourse zu erstellen, sondern sie auch als E-Book (epub oder pdf) zu veröffentlichen (das ist meine Antwort auf die Frage „Warum nicht Seitenveröffentlichung nutzen?").
Ich habe weitgehend denselben Ansatz verfolgt: eine YML-Datei und ein Array von Post-URLs.
Bilder waren ein Thema, aber ich habe immer noch den Python-Code herumliegen, der alle upload://-Links extrahiert, decodiert, die Bilder herunterlädt, sie in der Größe anpasst und die Links in lokale Bild-URLs umwandelt.
Ich habe das Projekt nie abgeschlossen, aber ich wäre sehr daran interessiert, es wieder aufzugreifen und die (wenigen) Dinge beizutragen, die ich bereits erstellt habe.