مشاكل يواجهها Google Search Console بسبب هيكلة الخطاب غير الصحيحة أو إدارة موقعي بشكل خاطئ

Bathinda · 17 ديسمبر 2024، 9:22ص

بعد زوال الهستيريا الأولية (التي قد تصيب الشخص الذي يكتشف أن جوجل لم تولِ اهتمامًا لموقعه الإلكتروني طوال الأشهر الستة الماضية ولم يكن يعرف بذلك حتى!!)،

سأحاول سرد الأسباب المتعلقة بكود Discourse فقط، أي تلك التي لا يمكنني أنا أو جوجل إصلاحها (على حد علمي)، ولكن يمكن لفريق Discourse إصلاحها.

محظور بواسطة ملف Robots.txt:

image396×173 7.54 KB
خطأ في الخادم 5xx

إشعار بريد إلكتروني من Google Search Console حول فهرسة الصفحات بسبب خطأ في الخادم. (تم التعليق بواسطة الذكاء الاصطناعي)378×352 14.9 KB
محتوى أعرض من الشاشة و عناصر قابلة للنقر قريبة جدًا من بعضها البعض (على شاشة الهاتف المحمول)

بريد إلكتروني إعلامي ينبه إلى مشكلات جديدة في قابلية الاستخدام على الهاتف المحمول تم اكتشافها لموقع ويب، مع توصيات لإصلاح المشكلات لتمكين أفضل تجربة وتغطية في بحث Google. (تم التعليق بواسطة الذكاء الاصطناعي)398×538 27.1 KB
مشكلات البيانات المنظمة لمنتدى المناقشة:

image385×244 12.9 KB
مشكلات فهرسة الفيديو، ولكن لا توجد تفاصيل أخرى:

تظهر الصورة إشعارًا بشأن مشكلات فهرسة الفيديو على موقع ويب. (تم التعليق بواسطة الذكاء الاصطناعي)376×512 25.1 KB

عند النقر على “تقرير فهرسة الفيديو”:

وعند النقر على رابط “التحسينات > مقاطع الفيديو”:

الرجاء المساعدة.

Bathinda · 17 ديسمبر 2024، 10:49ص

في وقت سابق عندما صادفت المشكلة (كل هذا يمكن تخطيه)::

بعد عدة أشهر من فقدان المستخدمين، اكتشفت اليوم أن موقعي قد تم حظره/منعه من جوجل!!!

في وقت سابق، كيف اكتشفت هذه المشكلة، كل هذا يمكن تخطيه:

لقد قرأت تقريبًا كل ما ورد في هذا الموضوع في ميتا قبل طرح السؤال.

في أغسطس 2024، لاحظت أن حركة المرور إلى موقعي قد انخفضت بنسبة تصل إلى 95%. لكنني تجاهلت الأمر معتقدًا أنني ربما لم أنشر ما يكفي.

ولكن اليوم اكتشفت أنه مهما كانت الكلمة المفتاحية التي أبحث بها على جوجل، مع حصر البحث في موقعي فقط: ***site:BathindaHelper.com jobs in bathinda*** ، كانت النتيجة صفرًا (النتيجة الوحيدة التي تظهر من موقعي هي في الواقع مجرد اقتراح بإنشاء إعلانات جوجل لعرض هذه النتيجة من موقعي، مما يشير إلى أن موقعي قد تمت فهرسته بالفعل):

وأخيرًا، قمت أيضًا بالتحقق من تحليلات جوجل (ربما تم تغيير اسمها إلى أحداث جوجل) وهي تُظهر بوضوح أنه منذ 17 يونيو 2024، لم تعد جوجل تشير إلى موقعي.

Jagster · 17 ديسمبر 2024، 11:58ص

متى قمت بإنشاء موقعك إما باستخدام تسجيل الدخول الإجباري أو توقفت عن عرض المواضيع TL0+؟ يمكن لجوجل استخدام موقع فقط إذا كان مرئيًا للعالم. أو قمت بحظر وكلاء المستخدم الخاص بجوجل.

هل هذا هو نفس المنتدى الذي واجهت فيه مشاكل في DNS؟

Moin · 17 ديسمبر 2024، 12:02م

هل تسأل بسبب Site does not appear in google searches - #2 by Bathinda أعتقد أن الرد أدناه يجيب على سؤال صاحب الموضوع الأصلي.

Bathinda · 17 ديسمبر 2024، 12:05م

لقد استخدمت كلمة “force” بشكل خاطئ. (كنت أقصد أن أقول إنني كنت أجبر بحث Google على إنتاج نتائج بحث من موقعي الخاص BathindaHelper.com)

لم أنشئ موقعي باستخدام أي طريقة غير طبيعية / قسرية.
لم أعبث عمدًا بأي شيء يتعلق بـ TL0+ أو ما شابه.
خلال النصف ساعة الماضية، وجدت أن ملف robots.txt الخاص بي هو السبب (من بين بعض المشكلات الصغيرة الأخرى)، لكنني لم أتمكن من معرفة (حتى الآن) كيفية إصلاح ذلك.
لا أتذكر أنني واجهت مشكلات في DNS (هل تتحدث عن الماضي البعيد؟). موقعي يعمل بشكل جيد، باستثناء أنه عندما أقوم أنا / المسؤول بتحديث المتصفح يدويًا، فإنه يستغرق أحيانًا ما يقرب من 30 إلى 50 ثانية ليفتح، ولكن بعد ذلك يعمل بشكل جيد.

شكراً على الرد.

تعديل:
لقد “ألغيت تحديد” خيار ملف الروبوتات:

لكن لا يمكنني القول ما إذا كانت وحدة تحكم بحث Google تبلغ عن أن كل شيء على ما يرام أم لا الآن:

Jagster · 17 ديسمبر 2024، 12:12م

نعم، لقد فاتني الطلب تمامًا. والآن لدينا عرض توضيحي لما يمكن أن يحدث عندما

تم الرد على مواضيع قديمة
مواضيع غير ذات صلة
لا يقرأ المستخدم المواضيع

نعم، خطئي.

Jagster · 17 ديسمبر 2024، 12:24م

تحقق من هذه الإعدادات:

allowed crawler user agents (وكلاء الزحف المسموح بهم)
blocked crawler user agents (وكلاء الزحف المحظورون)

لكن على حد علمي، لا يحتوي Discourse على ملف robots.txt عادي كما هو الحال في معظم المواقع، بل يتم إنشاؤه بواسطة شيء غريب بلغة Ruby، ولا توجد الكثير من الإعدادات التي يمكن للمسؤول تعديلها. باستثناء هذين الإعدادين، وإبطاء الروبوتات.

لقد كنت أنا فقط وأصابعي السريعة

Moin · 17 ديسمبر 2024، 12:34م

هل قمت بتعطيل ذلك الآن أم قبل توقف الفهرسة؟

حدد في robots.txt أن هذا الموقع مسموح بفهرسته بواسطة محركات البحث على الويب.

إذا كنت لا تسمح لمحركات البحث بفهرسة موقعك، فلا يفاجئني أنهم لا يفعلون ذلك.

Bathinda · 17 ديسمبر 2024، 1:45م

سأفعل وأبلغ.

لقد قمت بتعطيل هذا بعد فتح هذا الموضوع (قبل حوالي 30 دقيقة). بينما كانت هذه المشكلة موجودة منذ 3 أشهر. لكنني لم أتمكن من التحقق بشكل مستقل مما إذا كان هذا “إلغاء التحديد” قد أصلح خطأ “فهرسة Google” أم لا.

أنا في شك إذا لم أقم بتعطيل / حظر المواقع بواسطة Robots.txt، فهل جميع المواقع مسموح بها؟ أم العكس، إذا لم أقم بتمكين المواقع بواسطة Robots.txt، فهل جميع المواقع محظورة من الفهرسة؟

Jagster · 17 ديسمبر 2024، 1:49م

لقد نسيت ذلك تمامًا. يجب عليك تحديده. إذا لم تستخدم ذلك، فيجب عليك التحقق من ملف robots.txt وتعديله يدويًا للتأكد من أنه يوجه الروبوتات كما تريد.

ولكن يمكنك إلقاء نظرة إذا وجدت هناك شيئًا من شأنه أن يوقف جوجل.

Bathinda · 17 ديسمبر 2024، 1:54م

حسناً.
هذا يعني أن جميع مستخدمي Discourse (عادةً) سيحتاجون إلى تحديد/تقديم ملف ‘Robots.txt’.
وسأقرأ الموضوع المتعلق بهذا (كيف وماذا يجب أن يكون في هذا الملف) بالتفصيل غداً.

ثانياً، إذا لم يكن الأمر كبيراً جداً للشرح، هل يمكنك إخباري بأي طريقة سهلة يمكنني من خلالها تعديل بعض الإعدادات في لوحة تحكم Discourse الخاصة بي وفي نفس الوقت التحقق مباشرة/في الوقت الفعلي مما إذا كان Google قادراً الآن على الوصول (ثم فهرسة) موقعي بحرية أم أنه لا يزال يحصل على خطأ ‘Access Forbidden - 403’؟!

تعديل: على الرغم من أنني سأحاول بنفسي العثور على موارد مماثلة على جوجل الآن/لاحقاً.

Jagster · 17 ديسمبر 2024، 1:57م

حسنًا، لا. هذا يعني أن المسؤولين عادةً ما يبقون robots.txt ممكّنًا لتجنب العبث اليدوي ولكن بالتأكيد، قائمة الروبوتات المحظورة وما إلى ذلك هي ما يريد المسؤول تعديله.

nat · 18 ديسمبر 2024، 9:38ص

هل يمكنك التحقق من إعداداتك لـ blocked_crawler_user_agents؟

Bathinda · 18 ديسمبر 2024، 11:06ص

هذا الإعداد يبدو كالتالي (لم أقم بتغيير أي شيء):

لقطة شاشة تعرض صفحة إعدادات مع خيارات لحظر وإبطاء وكلاء زحف محددين. (تم تعليقه بواسطة الذكاء الاصطناعي)808×252 20.9 KB
هنا كتبت هذين النطاقين google و google.com بالأمس، كتجربة، لا أعرف ما إذا كان هذا له الأولوية على ‘Blocked Crawler User Agents’ أم لا. أو ما إذا كان هذا قد حل مشكلتي أم لا (لأن جوجل تقول إنها قامت بجدولة طلب الزحف/الفهرسة الخاص بي، والذي قد يستغرق ما يصل إلى 2-3 أيام):

الصورة عبارة عن لقطة شاشة لصفحة إعدادات مع خيارات لوكلاء الزحف المسموح بهم والمحظورين، مع وظيفة البحث أو الإنشاء. (تم تعليقه بواسطة الذكاء الاصطناعي)755×163 6.2 KB
ويمكنك العثور على ملف 'Robots.txt’ الخاص بي هنا.

يرجى إخباري بأي منها له الأولوية إذا كانت جميع الإعدادات الثلاثة متعارضة.

Firepup650 · 18 ديسمبر 2024، 11:42ص

لا ينبغي أن يكون لذلك أي تأثير، حيث تستخدم Google " Googlebot " ومتغيراتها للزحف:

Bathinda · 18 ديسمبر 2024، 11:49ص

بالتأكيد كان لذلك التأثير الرئيسي!!

شكراً لكم جميعاً، شكراً جزيلاً لمساعدتي في حل المشكلة الرئيسية الكبيرة، باستخدام هذا الإعداد:

ولكن بالنسبة للعديد من المشكلات الأخرى (الصغيرة) التي تؤثر على فهرسة جوجل، والتي شرحتها في المنشور الأول لهذا الموضوع الميتا، أود أن أبقي الموضوع مفتوحًا.

أيضًا، سأكون ممتنًا إذا أمكن لشخص ما أن يخبرني ماذا يحدث إذا قمت بحظر الزاحف-1 لموقع ما ضمن “وكلاء الزاحف المحظورين” وفي نفس الوقت سمحت به ضمن “وكلاء الزاحف المسموح بهم”.
وماذا يحدث إذا سمحت به ضمن “المسموح به…” ولكني حظرته من خلال ملف Robots.txt. ما الذي له الأولوية.

Jagster · 18 ديسمبر 2024، 12:20م

يجب عليك إزالة compatible. إنها تمنع كل شيء تقريبًا، بما في ذلك googlebot. لهذا السبب:

Mozilla/5.0 (compatible; Googlebot/2.1; +http://www.google.com/bot.html)

وحظر فيسبوك ليس فكرة جيدة أيضًا، إذا كنت تشارك مواضيع في فيسبوك.

كل ما تستخدمه في قائمة الحظر، يمنع جميع الروبوتات التي تحتوي على هذه الكلمة في سلسلة وكيل المستخدم الخاصة بها. لذا، كن يقظًا.

Bathinda · 18 ديسمبر 2024، 12:24م

أوه ، ربما لهذا السبب ما زلت أتلقى خطأ أثناء محاولة الزحف / فهرسة أي مواضيع (باستثناء الصفحة الرئيسية) عبر Google Search Console:
![رسالة خطأ تشير إلى عدم إمكانية فهرسة صفحة ويب بسبب رفض الوصول ، مع تفاصيل محددة حول عملية الزحف والفهرسة. (تم تعليقه بواسطة الذكاء الاصطناعي) | 690x415] (upload://rmkNdaInvq86MvDQdy3vhtG7eP3.png)

ولكن لماذا (حتى عندما تم حظر ‘متوافق’) الصفحة الرئيسية فقط متاحة لـ Google Search Console ، كما هو موضح أدناه:
![تُظهر الصورة صفحة نتائج فحص عنوان URL في Google ، وتشير إلى أن عنوان URL موجود على Google ، وأن الصفحة مفهرسة ، وأن الصفحة يتم تقديمها عبر HTTPS. (تم تعليقه بواسطة الذكاء الاصطناعي) | 690x375] (upload://8UNjJgkTFLktTsOXQqhHfiWHIaa.png)

لقد قمت للتو بإزالة ‘متوافق’ وسأبلغ عن ذلك.

Bathinda · 18 ديسمبر 2024، 12:41م

أخيرًا!!! يبدو أنني تغلبت على خطأ “محظور” للصفحة الرئيسية/الصفحة الرئيسية والمواضيع الفردية، بمساعدة 90% من جانبكم و10% تجريب من جانبي. شكرًا جزيلاً.

بعد إزالة “متوافق” من قائمة “الزواحف المحظورة”، وجدت ملاحظة تحت إعداد آخر، والتي، من الغباء مني تجاهلها، كانت تطلب أساسًا من المستخدمين عدم ملء أي قيمة في “وكلاء الزحف المسموح بهم” إلا إذا كنت متأكدًا تمامًا مما تفعله. لذا كان هذا هو السبب! تجاهل التحذير المكتوب بأحرف كبيرة جلب لي شهورًا عديدة من تجاهل جوجل لموقعي والكثير من المتاعب:

لأي شخص يأتي إلى هذا الموضوع بسبب خطأ “الوصول ممنوع-403” في Google Search Console:

بشكل أساسي، شيئان حلّا مشاكلي، أحدهما إزالة “متوافق” من “قائمة الزواحف المحظورة” و
إفراغ (كما هو افتراضي) إعداد “وكلاء الزحف المسموح بهم”.

سيظل الموضوع مفتوحًا لمشاكل بحث جوجل الأخرى (على الرغم من أنها ليست حرجة مثل هذه).

الموضوع		الردود	مرات العرض
Why isn't Google Indexing Discourse? SEO concerns Support seo	31	5270	1 يونيو 2024
Needing to edit robots.txt file - where is it? Support	42	7574	29 أبريل 2023
Google complaining – Indexed, though blocked by robots.txt Support	24	2496	28 سبتمبر 2023
Malformed robots.txt causing issues with indexing Support	9	1848	21 أبريل 2023
Sitelinks in Google disappearing Community	26	1430	27 يناير 2023

مشاكل يواجهها Google Search Console بسبب هيكلة الخطاب غير الصحيحة أو إدارة موقعي بشكل خاطئ

في وقت سابق عندما صادفت المشكلة (كل هذا يمكن تخطيه)::

في وقت سابق، كيف اكتشفت هذه المشكلة، كل هذا يمكن تخطيه:

لأي شخص يأتي إلى هذا الموضوع بسبب خطأ “الوصول ممنوع-403” في Google Search Console:

الموضوعات ذات الصلة