これは完全に追求する価値があります。ただし、私はバイアスがかかっています。数年前に趣味のプロジェクトとして、似たようなものを開発していたからです。
目標は、Discourse のキュレーションされたコンテンツから Jekyll サイトを作成できるだけでなく、それを電子書籍(epub または pdf)として公開できるようにすることでした(これが「なぜページパブリッシングを使わないのか」という問いに対する私の答えです)。
私はほぼ同じアプローチを採用しました。yml ファイルと投稿 URL の配列を使用するものです。
画像処理も課題でしたが、upload:// リンクをすべて取得し、デコードして画像をダウンロード・リサイズし、ローカル画像 URL にリンクを書き換える Python コードがまだ手元に残っています。
プロジェクトは完成させませんでしたが、すでに作成した(いくつかの)ものを再び取り上げて貢献することに興味があります。