Eu tive a mesma ideia há muito tempo, mas só consegui configurá-la há uma semana.
Separadamente do Discourse, o método que eu pessoalmente uso há muito tempo é a extensão de navegador SingleFile. Ela salva o site que você está visualizando como um único arquivo HTML, preservando-o o mais próximo possível do que você vê, para que você possa lê-lo offline. Existem inúmeros arquivos HTML guardados na minha pasta \~/Downloads.
Como a informação na internet não fica lá para sempre, a maneira mais confiável é salvar o que você vê atualmente no seu próprio computador exatamente como está.
Eu já tenho muitos arquivos HTML salvos, e muitos mais serão adicionados no futuro, então tenho pensado em um recurso que me permitiria trazer esses arquivos para o Discourse para visualizá-los e gerenciá-los lá.
Se você está planejando adicionar um recurso para “raspar” ou recortar conteúdo de sites, isso acabará se sobrepondo bastante com o que a extensão SingleFile já faz bem.
Seria ótimo se houvesse uma maneira de integrar diretamente com o SingleFile ou de importar arquivos HTML.