أي تحديثات حول أفضل طريقة لإنشاء أرشيف HTML لموقع ثابت؟

تحديث!

قد يكون هذا هو الحل:

نظرت في:
Improving Discourse static HTML archive.
إنه قديم.

سأقوم بإيقاف https://forum.talksurf.com/.
نعم، سأقوم بأرشفة نسخة احتياطية.

ولكن ماذا لو أردت فقط بعض ملفات HTML القابلة للتصفح؟

هل يجب علي فقط تشغيل https://github.com/kitsandkats/ArchiveDiscourse/blob/master/archive-discourse.py؟

أم أن هناك شيئًا أفضل؟

شكراً مقدماً!

نسخ: @pfaffman
ألوها،

جاستن

هل سيكون شيء مثل Wayback Machine مشابهًا؟

لقد نجح هذا. كان عليّ إجراء تحديث طفيف للكود.

3 إعجابات

لكنه ليس أقدم بكثير من إصدار Discourse الخاص بك!

لقد حققت بعض النجاح في عكس المواقع باستخدام wget. شيء مثل

wget --mirror --page-requisites --convert-links --adjust-extension --compression=auto --reject-regex "/search" --no-if-modified-since --no-check-certificate --execute robots=off --random-wait --wait=1 --user-agent="Googlebot/2.1 (+http://www.google.com/bot.html)" --no-cookies --header "Cookie: _t=$COOKIE" https://forum.talksurf.com/

ولكن تحتاج إلى الحصول على ملف تعريف الارتباط المسمى _t

أرسل لي بريدًا إلكترونيًا وسأرى ما يمكنني فعله.

إعجاب واحد (1)

لقد كنت أفعل هذا مؤخرًا، وهذه هي الطريقة التي فعلتها بها.

 def serve
    file_path = File.expand_path(
      params[:path]+"."+params[:format],
      File.join(File.dirname(__FILE__), "../../public")
    )
    if File.file?(file_path)
      send_file file_path, type: "text/html", disposition: "inline"
    else
      render plain: "404 Not Found", status: 404
    end
  end

لمجرد إعلامك، هذا لا يسحب الصور بعنوان URL جديد. ستظل الصور تشير إلى الخادم الخاص بك (الذي على وشك إيقاف تشغيله!).

أرسل لي جاي اللقطة بلطف وقارنتها بلقطتي.

تقنيته تعمل بشكل أفضل من حيث أنها تحفظ الصور.

ومع ذلك، فإن روابطه الداخلية لا تشير إلى المقالات، بل إلى الموقع الذي تم إيقافه. ومع ذلك، يمكن العثور على المقالات مع الصور.

سيكون من “اللطيف الحصول عليه” إذا كان Discourse يدعم تصديرًا ثابتًا. :ابتسامة:

إعجابَين (2)

الشيء الجيد هو أن لديك كل البيانات، لذلك يمكن كتابة أداة تصدر البيانات مباشرة من نسخة احتياطية إذا كان لدى أي شخص الرغبة في القيام بذلك.

لكننا لسنا من سيقوم بكتابتها :wink:

إعجاب واحد (1)

لا ينبغي أن يكون من الصعب جدًا إصلاح الروابط الداخلية، ويبدو أنها تحتاج فقط إلى إضافة .html