إضافة خريطة الموقع - لا عناوين ?page=… في خريطة الموقع الافتراضية

لا يتضمن المكون الإضافي sitemap أي عناوين URL ?page=… في الخرائط الأساسية الافتراضية، على سبيل المثال https://meta.discourse.org/sitemap_4.xml

<url>
  <loc>
    https://meta.discourse.org/t/importing-migrating-from-phpbb3/30810
  </loc>
  <lastmod>2022-02-25T21:55:40Z</lastmod>
</url>

في الخريطة الأخيرة، يتم تضمين عناوين URL لترقيم الصفحات - على سبيل المثال https://meta.discourse.org/sitemap_recent.xml

<url>
  <loc>
    https://meta.discourse.org/t/importing-migrating-from-phpbb3/30810?page=18
  </loc>
  <lastmod>2022-03-07T12:03:50Z</lastmod>
</url>

هل لا توجد عناوين URL ?page=… في الخرائط الافتراضية حسب التصميم؟
جميع عناوين URL ?page=… هذه هي عناوين URL قياسية وبالتالي يجب إضافتها إلى الخريطة الافتراضية - على سبيل المثال

<url>
  <loc>
    https://meta.discourse.org/t/importing-migrating-from-phpbb3/30810
  </loc>
  <lastmod>2022-02-25T21:55:40Z</lastmod>
</url>
<url>
  <loc>
    https://meta.discourse.org/t/importing-migrating-from-phpbb3/30810?page=2
  </loc>
  <lastmod>2022-03-02T19:08:07Z</lastmod>
</url>

[...]

<url>
  <loc>
    https://meta.discourse.org/t/importing-migrating-from-phpbb3/30810?page=18
  </loc>
  <lastmod>2022-03-07T12:03:50Z</lastmod>
</url>

المصادر

إعجابَين (2)

لا أعتقد أن هذا متعمد، هل يمكنك إنشاء طلب سحب لإصلاحه؟

شكرا @rrit، لاحظت هذا قبل بضعة أشهر أيضًا ولكني اعتقدت دائمًا أنه طبيعي :man_facepalming:t2:

يمكنني تطبيق حل سهل ليس محددًا جدًا بشأن تاريخ آخر تعديل: على سبيل المثال، ستستخدم جميع صفحات موضوع واحد نفس تاريخ آخر مشاركة تم تحريرها.
وبالتالي، عند نشر مشاركة جديدة في موضوع (يحتوي على العديد من المشاركات والعديد من الصفحات)، ستحصل جميع الصفحات على تاريخ تغيير أخير جديد - حتى عندما تحتاج الصفحة الأخيرة فقط إلى التاريخ الجديد.

هل هذا حل ممكن؟


بخلاف ذلك، نحتاج إلى تجميع جميع مشاركات الموضوع في حزم من 20 مشاركة (لكل صفحة). ثم حساب تاريخ آخر تغيير لكل حزمة بنفسها.

بصراحة، نظرت في هذا وأنا متردد بشأن أي تغييرات هنا، المشكلة ليست أن جوجل تواجه صعوبة في اكتشاف المحتوى على منتديات Discourse.

بل إنها تكتشف المحتوى وتزحف إليه، ثم بسبب “اتخاذ قرارات تعسفية” تقرر أن المحتوى لا ينتمي إلى الفهرس.

إعجاب واحد (1)

هل يعني “اتخاذ قرارات عشوائية” إحدى هذه النقاط:
(انظر Page indexing report - Search Console Help)


على الجانب الإيجابي لإضافة جميع عناوين URL الأساسية ?page=… إلى خريطة الموقع:
إنها تعطي Google تلميحًا قويًا بشأن \u003clastmod\u003e لعناوين URL هذه. وبالتالي، ليس لدى Google سبب لإعادة الزحف إلى عناوين URL ?page=… التي لم تتغير، وقد تستخدم ميزانية الزحف الثمينة الخاصة بها لعناوين URL الأكثر أهمية.

إذا كانت عناوين URL ?page=… مفقودة في خريطة الموقع، فإن Google تجدها على أي حال وتقوم ببعض عمليات إعادة الزحف “العشوائية” - حتى لو كانت غير ضرورية تمامًا حيث لا توجد تغييرات جديدة على المحتوى.

انظر Build and Submit a Sitemap | Google Search Central  |  Documentation  |  Google for Developers


تتتبع Google حقًا وتحدث فرقًا بين المكان الذي تعرف فيه عناوين URL من:
“جميع الصفحات المرسلة” (خريطة الموقع) أو “جميع الصفحات المعروفة” (الروابط وما إلى ذلك)
انظر وحدة تحكم بحث Google –\u003e الفهرس –\u003e تقرير التغطية

  • “تعد خريطة الموقع طريقة مهمة لـ Google لاكتشاف عناوين URL على موقعك.” انظر
  • “تختار Google الصفحة الأساسية بناءً على عدد من العوامل (أو الإشارات)، مثل [… ]، وجود عنوان URL في خريطة الموقع، […].” انظر
  • “لا يضمن استخدام خريطة الموقع أنه سيتم الزحف إلى جميع العناصر الموجودة في خريطة الموقع وفهرستها، حيث تعتمد عمليات Google على خوارزميات معقدة لجدولة الزحف.” انظر
إعجاب واحد (1)

آمل أن يتم تنفيذه جنبًا إلى جنب مع هذا :slight_smile:

إعجابَين (2)

هذا بالتأكيد شيء يجب أن يأخذه @Roman في الاعتبار عند دمجه في النواة.

أفضل بكثير دمج خريطة الموقع أولاً قبل إضافة المزيد من التغييرات، ولكن بمجرد الانتهاء من ذلك… ربما يمكننا البدء بعناوين URL للصفحات القياسية على _recent. لدينا عنوان URL قياسي الآن يمكن استخدامه في posts.rss مع التخزين المؤقت الكافي يمكن استخدامه أيضًا في خرائط المواقع.

3 إعجابات

أواجه مشكلة مع Google Search Console في محاولة فهرسة عناوين URL مثل https://example.com/t/title-slug/1234?page=3، مما يجعل Discourse يرمي خطأ 404. إزالة المعلمة ?page=x تجعل عنوان URL صالحًا.

أفترض أن هذا نوع من الآثار الجانبية لـ Discourse الذي يضيف ترقيم الصفحات إلى الإصدار من الموقع الذي يقدمه للزواحف:

تعمل عناوين URL للصفحات بشكل جيد، تحتاج فقط إلى المزيد من N مشاركات.

هل لديك الكثير من المشاركات المحذوفة حول هذا الموضوع؟

مرحباً سام، شكراً على الرد. بعد نشر هذا، وجدت شرحك هنا:

ولكن في حالتي، لا، المواضيع التي بها هذه المشكلة والتي نظرت إليها لا تظهر أي تعديلات على التسلسل الأصلي. الشيء الوحيد هو أنها تم استيرادها من Drupal. ولكن أحتاج إلى التعمق أكثر في أمثلة أخرى لمعرفة ما إذا كانت أي مواضيع تم إنشاؤها في الأصل في Discourse تتأثر أيضاً، لأنه للأسف هناك أطنان منها، بالآلاف ربما.

إعجاب واحد (1)

يا إلهي، هل تم استيراد أطنان من Drupal؟ هل هذا هو الخيط المشترك هنا؟

نعم، ما يقرب من 100 ألف موضوع وحوالي 2 مليون مشاركة. لست متأكدًا مما إذا كانت هذه المشكلة تتعلق فقط بالمواضيع المستوردة، سأعود إلى هنا قريبًا إذا وجدت أي شذوذات أخرى.

إعجاب واحد (1)