أداة أرشفة Discourse الأساسية

لا يعمل httrack بالنسبة لي. أستخدم:

httrack https://my-forums.org --user-agent "Googlebot"

httrack واعد جدًا، لكن خيوط المنتدى الطويلة التي تحتوي على صفحات متعددة غير مكتملة. بمجرد النقر على “الصفحة 2” لا يعمل. أي:

  • file:///home/user/My%20Web%20Sites/my-forums/my-forum.org/t/forum-thread-title/83394658.html يبدو جيدًا حقًا (لا يجلب من موارد خارجية)، لكن
  • file:///home/user/My%20Web%20Sites/my-forums/my-forum.org/t/forum-thread-title/83394658.html?page=2 معطّل.

هل هناك أي اقتراحات؟

ربما يمكن إخبار httrack بطريقة ما بـ “استخدام وضع الطباعة”؟

ربما يمكن إخبار httrack بـ “إضافة /print في النهاية”؟

هل توجد إعدادات لوكيل المستخدم تُظهر خيط المنتدى بأكمله في صفحة واحدة؟ إذا لم يكن الأمر كذلك، هل يمكنك إضافة هذه الميزة؟ لقد قمت بالفعل بتطبيق وضع الطباعة. معظم الأشياء مُطبّقة بالفعل. ما تبقى هو وكيل مستخدم يؤدي إلى توفير المحتوى المُولّد لـ “وضع الطباعة” لبرنامج الزحف؟ بدلاً من ذلك، إذا لم يعجبك فكرة وكيل مستخدم مخصص لهذا الغرض، فما رأيك في رأس HTTP أو ملف تعريف ارتباط يمكن استخدامه لهذا الغرض؟


ArchiveDiscourse محسّن/مُفرّغ بواسطة بواسطة @kitsandkats هو أيضًا معطّل بالنسبة لي.


هل يمكنك أيضًا النظر في تطبيق /print للصفحة الرئيسية / صفحات التصنيفات؟


أقتبس نفسي في https://meta.discourse.org/t/i-dont-like-infinite-scrolling-and-want-to-disable-it/104660/3

(تعطيل التمرير اللانهائي مؤقتًا) (لبعض وكلاء المستخدم) سيجعل من الممكن أرشفة discourse باستخدام أداة أرشفة الويب htttrack.