إزالة روابط /2 و /3 و /4 وغيرها لكل رد داخل عنوان URL للموضوع

أتساءل عما إذا كانت هناك طريقة لإزالة الروابط الكنسية تمامًا من منتدى Discourse.

أشير إلى الامتدادات /2، /3، /4، وما إلى ذلك، التي تظهر لكل عنوان URL للموضوع أثناء تمرير المستخدم لأسفل الصفحة. أود أن يشير كل رد داخل موضوع ببساطة إلى عنوان URL الأصلي (دون إعادة توجيه الزوار إلى عنوان URL الأصلي، ولكن بإزالة هذه المسارات تمامًا، بحيث لا تكون موجودة).

في الأصل، اعتقدت أن هذه ميزة رائعة في Discourse، ولكن بينما كنت أدير منتدى مشابهًا على موقعي باستخدام NodeBB (الذي يستخدم نفس ميزة الروابط الكنسية لكل رد)، اكتشفنا أن هذه الوظيفة يمكن أن تكون كارثية على تحسين محركات البحث (SEO) للمنتدى العام.

لماذا؟ لأنه حتى لو كانت عناوين URL هذه /2، /3، /4 روابط كنسية، فإن Google ستزحف إلى جميعها وتفهرسها في النهاية. هذا يعني أن كل رد جديد داخل موضوع يمكن أن يظهر في نتائج بحث Google، وبما أنها في الأساس نسخ مكررة من عنوان URL الأصلي للموضوع، فإن هذه الصفحات الإضافية المفهرسة نادرًا ما تحصل على زيارات، وعندما تفعل ذلك، لا يبقى الزوار على الموقع لأكثر من بضع ثوانٍ.

عندما تفهرس Google الكثير من الصفحات الإضافية ولا تحصل هذه الصفحات على الكثير من النشاط، فإن ذلك يخبر Google بأن النطاق ككل يحتوي على الكثير من عناوين URL منخفضة الجودة وهذا يضر بصحة النطاق ككل (كما حدث في حالتنا). فقدنا حوالي 40٪ من حركة المرور لدينا منذ إطلاق منتدانا العام، وكان أحد العوامل المساهمة الكبيرة هو عناوين URL الإضافية هذه (تمت إضافة أكثر من 30,000 عنوان URL منخفض الجودة إلى خريطة الموقع لدينا على مدار 12 شهرًا، ببساطة بسبب الردود التي تم تركها في كل موضوع).

الآن، إذا كنت تدير منتدى خاصًا، فلا يهم أي من هذا، لأن المنتدى الخاص لا يستفيد من أي نوع من تحسين محركات البحث (SEO) نظرًا لأن المنتدى بأكمله مخفي عن الإنترنت على أي حال. ولكن إذا كنت تحاول تشغيل منتدى عام وكان هدفك هو الحصول على حركة مرور من محركات البحث العضوية، فإن سلاسل عناوين URL الإضافية هذه يمكن أن يكون لها تأثير سلبي ضخم على الصحة العامة لموقعك.

لذا، أتساءل، هل هناك أي طريقة يمكن تصورها لتعديل الإعدادات أو إنشاء إضافة تخبر منتدى Discourse بعدم إنشاء عناوين URL إضافية لكل رد داخل موضوع؟

أفكر في ترحيل منتدانا من NodeBB إلى Discourse، ولكن هذا لن يكون منطقيًا إلا إذا كانت هناك طريقة لجعل منتدى Discourse الخاص بنا لا ينشئ عناوين URL إضافية هذه.

3 إعجابات

لقد ظهر هذا قليلاً من قبل: Google indexing same page multiple times: Issue with canonicals

كيف تمكنت من تحديد أن هذا كان مساهمًا كبيرًا؟ الكثير من منشورات تحسين محركات البحث (SEO) التي تم إجراؤها هنا كانت تخمينية إلى حد ما، لذا فإن بعض الأدلة تقطع شوطًا طويلاً!

ليس لدي أي خبرة مع هذا المكون الإضافي ولا يمكنني تزكيته شخصيًا، ولكن حاول شخص ما تعطيل روابط canonical بالكامل باستخدام مكون إضافي من قبل: Remove Canonical Link Plugin

7 إعجابات

\u003e لقد ورد هذا سابقًا قليلاً: فهرسة Google لنفس الصفحة عدة مرات: مشكلة في العلامات الكانونية\n\nإذا كنت أتابع هذه المحادثة بشكل صحيح، يبدو أن هذا يشير إلى مشكلة مختلفة قليلاً عما أتحدث عنه أعلاه. لا توجد مشكلة في إنشاء عناوين URL كانونية متعددة لموضوع إذا تم تجميعها بواسطة 20 ردًا في كل مرة ولها أوصاف تعريفية فريدة (page=2، page=3، إلخ). المشكلة هي عندما يتم إنشاء عنوان URL جديد لكل رد فردي داخل موضوع (/2، /3، /4، إلخ).\n\nبالنسبة لموضوع يحتوي على 100 رد، فإن الأول سينتج عنه 5 عناوين URL لكل موضوع (100 رد مجمعة في مضاعفات 20). أما الثاني فسينتج عنه 100 عنوان URL لكل موضوع (عنوان URL فريد لكل رد فردي)، مما يخلق مشكلة كبيرة في تحسين محركات البحث (SEO).\n\n\u003e كيف تمكنت من تحديد أن هذا كان مساهمًا كبيرًا؟ الكثير من منشورات تحسين محركات البحث (SEO) التي تم نشرها هنا كانت تخمينية إلى حد كبير، لذا فإن بعض الأدلة تقطع شوطًا طويلاً!\n\nباستخدام أدوات مثل Google Search Console و SEMrush و Ahrefs. سلطت جميعها الضوء على التحذيرات والأخطاء الناتجة عن العدد الهائل من عناوين URL على موقعنا التي تم إنشاؤها بواسطة ردود مواضيع المنتدى هذه، وكلها تم فهرستها بواسطة Google دون تقديم محتوى جديد كبير. كانت درجات الصحة في الثلاثينيات والأربعينيات عندما كان منتدانا عامًا. بمجرد أن قمنا بتأمين منتدانا بالكامل وجعلناه خاصًا (حتى لا تتمكن Google من رؤيته) وأعدنا تشغيل الاختبارات، ارتفعت درجة صحتنا إلى الثمانينيات من هذا التغيير وحده.\n\n\u003e ليس لدي خبرة في هذا المكون الإضافي ولا يمكنني تزكيته شخصيًا، ولكن حاول شخص ما تعطيل الروابط الكانونية تمامًا باستخدام مكون إضافي من قبل: مكون إضافي لإزالة رابط كانوني\n\nوجدت هذا أيضًا. للأسف، هذا المكون الإضافي يجعل الوضع أسوأ، لأنه يزيل العلامات الكانونية تمامًا مع الاحتفاظ بصفحات /2 و /3 وما إلى ذلك، لذلك لا تزال عناوين URL الإضافية هذه تُعتبر محتوى مكررًا منخفض الجودة.

3 إعجابات

تجدر الإشارة إلى أن إضافة ترويسة X-Robots-Tag: noindex إلى حمولة الاستجابة لتلك الصفحات موجودة في خارطة طريقنا.

10 إعجابات

من الجيد معرفة ذلك. يبدو أنها خطوة كبيرة في الاتجاه الصحيح.

على حد علمنا، لقد شهدنا بالفعل بعض الحالات في منتدانا الحالي (عندما كان لا يزال متاحًا للجمهور) حيث أضفنا ملف robots.txt إلى مجلدات فرعية معينة من منتدانا، وكانت جوجل تزحف إليها على أي حال. أعتقد أن هذا غير عادي للغاية… ولكن اكتشفنا أن هناك بعض الحالات التي لا تتبع فيها جوجل هذه التوجيهات. الطريقة الوحيدة للتأكد بنسبة 100٪ من عدم فهرسة صفحة ما هي إخفاء الصفحة خلف شاشة تسجيل دخول أو أن الصفحة غير موجودة على الإطلاق.

من منظور خارجي، يبدو أنه من السهل إخبار Discourse بعدم القيام بالخطوات الإضافية لإنشاء هذه عناوين URL الإضافية لكل رد. سيكون البرنامج يقوم بعمل أقل ويخلق تعقيدًا أقل بهذه الطريقة، أليس كذلك؟

سيكون من الجميل وجود ميزة في إعدادات المسؤول لتعطيل عناوين URL الإضافية هذه تمامًا.

إعجاب واحد (1)

نعم، بهذه الطريقة سنستخدم علامة الرأس بدلاً من وضعها في ملف robots.txt.

3 إعجابات

لست متأكدًا مما يحدث هنا.

لأن Discourse يفعل الأول: فهو ينشئ علامات تعريفية لعناوين URL الأساسية ?page=X لمجموعات من 20 ردًا. وكما ترى هنا، لا تتم إضافة أرقام المشاركات أبدًا إلى عناوين URL لخريطة الموقع، بل فقط عناوين URL ?page=X.

لذلك كنت سأخبرك أنه لا توجد مشكلة.

ولكن بعد ذلك أجريت بحثًا على Google لموضوع به العديد من الردود وعلى الرغم من أن الصفحة 2 من نتائج البحث هذه مليئة بروابط ?page=X، فإن بعض النتائج العليا ترتبط بالفعل بتلك الردود المرقمة.

ولكن لماذا يحدث هذا؟ هذه الصفحة لديها عنوان URL أساسي صحيح.

rgj@labgate:~$ wget -q -O - "https://meta.discourse.org/t/babble-a-chat-plugin/87297/418"|grep -e "<title" -e canonical
<title>Babble - A Chat Plugin - #418 by HAWK - broken-plugin - Discourse Meta</title>
<link rel="canonical" href="https://meta.discourse.org/t/babble-a-chat-plugin/87297?page=20" />

3 إعجابات

لا أعرف.

تخميني الجامح هو أن هذه الروابط تظهر في أماكن أخرى في البرية لذا فهي تلك التي يتم فهرستها؟

إعجاب واحد (1)

الـ Canonical موجود لمنع حدوث ذلك. على الأقل - نظريًا.

4 إعجابات

لقد أجريت مناقشة مطولة حول هذا الأمر مع مجتمع يركز على المدونات هنا في البرازيل يستخدم Discourse، وهذا ما دفعني إلى تجربة هذا النهج الجديد عن طريق إرسال ترويسة noindex لتلك الصفحات الخاصة بالمنشورات. يجب أن أكون قادرًا على تنظيف ودمج طلب السحب (PR) لذلك الأسبوع المقبل ويمكننا البدء في تجربته.

7 إعجابات

ولكن لماذا يحدث هذا؟ هذه الصفحة لديها عنوان URL أساسي صحيح.

بالضبط. لا ينبغي أن يحدث هذا (نظريًا) ولكنه يحدث، وكما اختبرنا مع موقعنا، فإنه يلحق ضررًا كبيرًا بنتيجة صحة النطاق، مما قد يؤثر سلبًا في النهاية على ترتيب البحث للنطاق بأكمله.

بخصوص ما قاله @pfaffman،

تخميني الجامح هو أن هذه الروابط تظهر في أماكن أخرى في البرية، لذا فهي التي تتم فهرستها؟

كان هذا ما سأفكر فيه أيضًا… لكننا رأينا أن عشرات الآلاف من هذه الردود الفردية على موقعنا تمت فهرستها بواسطة جوجل على الرغم من عدم وجود أي شيء يربط بها على الإطلاق. إنه أمر غريب جدًا ولا يمكنني الادعاء بفهم سبب / كيفية حدوث ذلك، ولكنه يؤكد على حاجة مسؤول المنتدى إلى القدرة ببساطة على إيقاف تشغيل عناوين URL هذه /2، /3، /4، وما إلى ذلك لكل رد إذا اختاروا ذلك.

أنا فضولي، هل من الصعب منح Discourse هذه القدرة؟ من وجهة نظري كشخص غير مبرمج، يبدو أن هذا يجب أن يكون سهلاً نظرًا لأنه مجرد إخبار البرنامج بعدم القيام بالكثير من العمل… ولكن ربما هناك شيء أكثر من ذلك لا أفهمه؟

إعجابَين (2)

لست متأكدًا، ولكن قد يكون وضع noindex عليها ضارًا. يتعامل Discourse بالفعل مع الأمر بشكل صحيح باستخدام عناوين URL الأساسية.

إذا وضعت noindex عليها، فهناك احتمال أن يؤدي ذلك إلى عدم فهرسة الصفحة بأكملها (لأنها جميعًا عناوين URL أساسية متطابقة)، وهو ما سيكون كارثيًا. لا أعرف على وجه اليقين ما سيحدث، ولكني سأكون حذرًا للغاية، لأن Google غالبًا ما يتعامل مع الحالات الاستثنائية بشكل غير متوقع، وكيفية تعاملهم معها يمكن أن تتغير مع التحديثات. لقد رأيت أشياء غريبة تحدث مع العلامات الأساسية.

من غير المعروف بالضبط كيف تعمل خوارزمية التصنيف، وهي تتغير بمرور الوقت، ولكن هناك شيء آخر يجب مراعاته وهو أن التصنيفات هي نتيجة للروابط الواردة. إذا قام موقع خارجي بالربط بعنوان URL /number، وعاد عنوان URL هذا برأس noindex، فمن الممكن ألا يقوم Google بنقل “عصير الرابط” الوارد إلى عنوان URL الأساسي، مما قد يضر بتصنيفات البحث لمواقع Discourse.

أعتقد أنه سيكون من الأكثر أمانًا الاتصال بشخص ما في Google Search وإخباره بأن العلامة الأساسية لا تعمل لنظام إدارة محتوى مستخدم على نطاق واسع بدلاً من محاولة إيجاد حل بديل قد لا يتم التعامل معه بنفس الطريقة مع قيام Google بإجراء المزيد من التحديثات.

6 إعجابات

لا، إنه يؤكد على الحاجة إلى إصلاح الأشياء. بصفتي مهندس برمجيات، أجد صعوبة بالغة في إزالة الوظائف لأنها لا تعمل بشكل صحيح بنسبة 100%. دعنا نرى ما إذا كان بإمكاننا المساعدة والوصول إلى جوهر المشكلة بدلاً من ذلك.

هل أنت متأكد من هذا؟ لم أر قط رقم منشور في خريطة الموقع.

3 إعجابات

لهذا السبب سيكون تحت إعداد الموقع.

5 إعجابات

شكرًا على التساؤل. ربما كانت كلمة “خريطة الموقع” هي الكلمة الخاطئة. ما قصدته هو أن هذه المشاركات المرقمة كانت تُزحف إليها وتُفهرس بواسطة جوجل وتظهر كصفحات فردية في تحليلات جوجل ووحدة تحكم البحث، مما أدى إلى وجود عدد كبير جدًا من الصفحات منخفضة الجودة على نطاقنا.

إذا لم تتم إضافة هذه الأرقام ببساطة إلى كل رد، فلن يتمكن جوجل من رؤية عنوان URL للمشاركة الأصلية فقط.

إعجابَين (2)

نعم، ولو كانت جوجل تحترم علامات rel="canonical" الوصفية (التي اخترعوها!) والتي تم وضعها هناك خصيصًا لمنع جوجل من القيام بذلك، لما كانت هناك مشكلة، ولا يزال بإمكاننا الارتباط بمنشور معين في نفس الوقت.

7 إعجابات

يبدو جيدًا. سيكون من المثالي إذا كان معطلاً افتراضيًا، لأنه ليس من غير المعقول أن يتسبب في اختفاء صفحات المواضيع من Google أو محركات البحث الأخرى.

لست متأكدًا مما إذا كان قد تم ذكره بالفعل، ولكن هناك طريقة أخرى لإصلاحه بدون noindex قد تكون استخدام أجزاء عنوان URL للمشاركات، حيث لا ينبغي احتسابها كصفحات منفصلة.

/t/slug/id#13
5 إعجابات

شكرًا على الاقتراح. أود أن أعتقد أن هذا سينجح… ولكن نظرًا لأن الطريقة الأصلية “الصحيحة” لا تعمل حتى الآن، فإن هذا يجعلني متشككًا في أن أي شيء سيحل المشكلة بخلاف مجرد إلغاء الردود المرقمة تمامًا.

بالطبع، لا أقول إن جميع مستخدمي Discourse يجب أن يتوقفوا عن استخدامها. في الواقع، لو لم تكن Google غبية (و/أو إذا كنا ننوي أن يكون منتدانا خاصًا وليس عامًا)، لكنت سأكون مؤيدًا تمامًا لذلك… ولكن مجرد وجود خيار لإيقاف الترقيم التلقائي للردود سيكون مساعدة كبيرة لأولئك الذين يديرون منتديات عامة ويهتمون بصحة تحسين محركات البحث العامة لنطاقهم.

إعجاب واحد (1)

هذا من شأنه أن يزيل القدرة على الربط بمنشورات محددة. لن تكون هناك طريقة للربط بالمنشور رقم 789 في موضوع مكون من 1000 منشور، وسيكون من المزعج للمستخدمين الاضطرار إلى التمرير إلى هذا الحد.

إنه غريب. لقد بحثت في جوجل لمعرفة ما إذا كانت عناوين URL لمعرفات المنشورات تتم فهرستها على منتدياتي، وتظهر فقط عناوين URL القياسية في جميع الموضوعات التي فحصتها.

أراها على موقع Discourse كبير آخر. تظهر أيضًا في هذا الموضوع. [استعلام Google]

لقد قمت بتشغيل مقارنة بين الاستجابتين على هذا النحو:

curl -s https://meta.discourse.org/t/removing-the-2-3-4-etc-links-for-each-reply-within-a-topic-url/209648 > 1.html
curl -s https://meta.discourse.org/t/removing-the-2-3-4-etc-links-for-each-reply-within-a-topic-url/209648/8 > 2.html
nvim -d 1.html 2.html

أحد الاختلافات البارزة هو أن article:published_time مختلف على الرغم من أنه يجب أن يكون متماثلًا، لأن الصفحات متطابقة تقريبًا. أتساءل عما إذا كانت هذه العلامة الوصفية يمكن أن تجعل Google تتجاوز عنوان URL القياسي. يقول موظف Google إن عناوين URL القياسية يمكن تجاهلها في حالات معينة عبر هنا.

<meta property="article:published_time" content="2021-11-19T15:57:21+00:00" />
<meta property="article:published_time" content="2021-11-20T06:48:06+00:00" />

أيضًا، هل علامة ignore_canonical فريدة لـ Discourse أم أن هناك احتمالًا أن Google قد تتبعها؟ رأيتها في HTML.

<meta property="og:ignore_canonical" content="true" />
3 إعجابات

قد يكون الأمر مزعجًا قليلاً، ولكن إذا كانت عناوين URL للصفحة=2، الصفحة=3، وما إلى ذلك لا تزال تعمل (وهو ما لا يمثل مشكلة في تحسين محركات البحث مثل الردود المرقمة)، فيمكنك على الأقل ربط شخص ما بالصفحة الصحيحة داخل محادثة. هذا سيجعله يصل إلى معظم الطريق، بشرط أن يكون مستعدًا للتمرير قليلاً.

أحد المنتديات التي تعمل بهذه الطريقة هو BiggerPockets. ردودهم لا تحتوي على عناوين URL مرقمة بشكل فردي، ولكن الموضوعات لديها صفحات مرقمة، مثل هذا: Kids throwing rocks at windows nearly everyday. Won't stop. (لاحظ عنوان URL أثناء التمرير عبر كل موضوع وصفحة).

لطالما كان منتداهم مكونًا رئيسيًا فيما يجعل الموقع مميزًا وناجحًا من منظور تحسين محركات البحث، لذا فهو مثال جيد على ما ينجح.

مثير للاهتمام. ليس لدي أي فكرة عما إذا كان هذا يسبب المشكلة أم لا، ولكن يمكنني أن أرى كيف أن عدم الاتساق قد يربك Google لتجاهل عنوان URL الأساسي.

حتى مع ذلك، مع طبيعة عمل المنتديات، ما لم تكن ترغب في إزالة التواريخ والأوقات لكل موضوع بالكامل، فلن تتمكن من القضاء على هذا، أليس كذلك؟ إن حساب التواريخ والأوقات لكل منشور ورد هو جزء لا يتجزأ من كيفية عمل المنتديات.

إعجاب واحد (1)