لا يعمل httrack بالنسبة لي. أستخدم:
httrack https://my-forums.org --user-agent "Googlebot"
httrack واعد جدًا، لكن خيوط المنتدى الطويلة التي تحتوي على صفحات متعددة غير مكتملة. بمجرد النقر على “الصفحة 2” لا يعمل. أي:
file:///home/user/My%20Web%20Sites/my-forums/my-forum.org/t/forum-thread-title/83394658.htmlيبدو جيدًا حقًا (لا يجلب من موارد خارجية)، لكنfile:///home/user/My%20Web%20Sites/my-forums/my-forum.org/t/forum-thread-title/83394658.html?page=2 معطّل.
هل هناك أي اقتراحات؟
ربما يمكن إخبار httrack بطريقة ما بـ “استخدام وضع الطباعة”؟
- مثال على عرض مناقشة المنتدى القياسي
- مثال على عرض مناقشة المنتدى المطبوع نفس الرابط مع إضافة /print فقط في النهاية
ربما يمكن إخبار httrack بـ “إضافة /print في النهاية”؟
هل توجد إعدادات لوكيل المستخدم تُظهر خيط المنتدى بأكمله في صفحة واحدة؟ إذا لم يكن الأمر كذلك، هل يمكنك إضافة هذه الميزة؟ لقد قمت بالفعل بتطبيق وضع الطباعة. معظم الأشياء مُطبّقة بالفعل. ما تبقى هو وكيل مستخدم يؤدي إلى توفير المحتوى المُولّد لـ “وضع الطباعة” لبرنامج الزحف؟ بدلاً من ذلك، إذا لم يعجبك فكرة وكيل مستخدم مخصص لهذا الغرض، فما رأيك في رأس HTTP أو ملف تعريف ارتباط يمكن استخدامه لهذا الغرض؟
ArchiveDiscourse محسّن/مُفرّغ بواسطة بواسطة @kitsandkats هو أيضًا معطّل بالنسبة لي.
هل يمكنك أيضًا النظر في تطبيق /print للصفحة الرئيسية / صفحات التصنيفات؟
أقتبس نفسي في https://meta.discourse.org/t/i-dont-like-infinite-scrolling-and-want-to-disable-it/104660/3
(تعطيل التمرير اللانهائي مؤقتًا) (لبعض وكلاء المستخدم) سيجعل من الممكن أرشفة discourse باستخدام أداة أرشفة الويب htttrack.