تحديث!
قد يكون هذا هو الحل:
نظرت في:
Improving Discourse static HTML archive.
إنه قديم.
سأقوم بإيقاف https://forum.talksurf.com/.
نعم، سأقوم بأرشفة نسخة احتياطية.
ولكن ماذا لو أردت فقط بعض ملفات HTML القابلة للتصفح؟
هل يجب علي فقط تشغيل https://github.com/kitsandkats/ArchiveDiscourse/blob/master/archive-discourse.py؟
أم أن هناك شيئًا أفضل؟
شكراً مقدماً!
نسخ: @pfaffman
ألوها،
جاستن
إعجاب واحد (1)
هل سيكون شيء مثل Wayback Machine مشابهًا؟
لقد نجح هذا. كان عليّ إجراء تحديث طفيف للكود.
3 إعجابات
pfaffman
(Jay Pfaffman)
4
لكنه ليس أقدم بكثير من إصدار Discourse الخاص بك!
لقد حققت بعض النجاح في عكس المواقع باستخدام wget. شيء مثل
wget --mirror --page-requisites --convert-links --adjust-extension --compression=auto --reject-regex "/search" --no-if-modified-since --no-check-certificate --execute robots=off --random-wait --wait=1 --user-agent="Googlebot/2.1 (+http://www.google.com/bot.html)" --no-cookies --header "Cookie: _t=$COOKIE" https://forum.talksurf.com/
ولكن تحتاج إلى الحصول على ملف تعريف الارتباط المسمى _t
أرسل لي بريدًا إلكترونيًا وسأرى ما يمكنني فعله.
إعجاب واحد (1)
翔_贺
(翔 贺)
5
لقد كنت أفعل هذا مؤخرًا، وهذه هي الطريقة التي فعلتها بها.
def serve
file_path = File.expand_path(
params[:path]+"."+params[:format],
File.join(File.dirname(__FILE__), "../../public")
)
if File.file?(file_path)
send_file file_path, type: "text/html", disposition: "inline"
else
render plain: "404 Not Found", status: 404
end
end
لمجرد إعلامك، هذا لا يسحب الصور بعنوان URL جديد. ستظل الصور تشير إلى الخادم الخاص بك (الذي على وشك إيقاف تشغيله!).
أرسل لي جاي اللقطة بلطف وقارنتها بلقطتي.
تقنيته تعمل بشكل أفضل من حيث أنها تحفظ الصور.
ومع ذلك، فإن روابطه الداخلية لا تشير إلى المقالات، بل إلى الموقع الذي تم إيقافه. ومع ذلك، يمكن العثور على المقالات مع الصور.
سيكون من “اللطيف الحصول عليه” إذا كان Discourse يدعم تصديرًا ثابتًا. :ابتسامة:
إعجابَين (2)
الشيء الجيد هو أن لديك كل البيانات، لذلك يمكن كتابة أداة تصدر البيانات مباشرة من نسخة احتياطية إذا كان لدى أي شخص الرغبة في القيام بذلك.
لكننا لسنا من سيقوم بكتابتها 
إعجاب واحد (1)
pfaffman
(Jay Pfaffman)
9
لا ينبغي أن يكون من الصعب جدًا إصلاح الروابط الداخلية، ويبدو أنها تحتاج فقط إلى إضافة .html
manuel
(Manuel Kostka)
10
لا زلت أود رؤية مولد أرشيف جيد لمنصة Discourse.
دعوا Claude يحاول ذلك، وأشارك هنا للإشارة ولإبقاء هذه الميزة في الصورة:
إعدادها أساسي حتى الآن: المواضيع، التصنيفات، الوسوم والمستخدمين. البحث يعمل أيضًا. قمت برفع أرشيف لنسخة تجريبية محلية إلى صفحة على GitHub:
3 إعجابات
pfaffman
(Jay Pfaffman)
11
هذا ربما أفضل من هذا.
الصق هذا لتعيين الكوكي إلى COOKIE، ثم الصق الكوكيات المنسوخة إلى الحافظة بواسطة امتداد Cooke في Chrome.
COOKIE=$(cat |jq -r '.[ ]|select(.name == "\_t")|.value')
أدخل الرابط هنا:
ثم الصق:
wget --mirror --page-requisites --convert-links --adjust-extension --compression=auto --reject-regex "/search" --no-if-modified-since --no-check-certificate --execute robots=off --random-wait --wait=1 --user-agent="Googlebot/2.1 (+http://www.google.com/bot.html)" --no-cookies --header "Cookie: \_t=$COOKIE" =FORUMURL=
4 إعجابات