يجب أن تتجاهل سجلات البحث مصطلحات العنصر النائب لـ OpenSearch وتضع علامة اختيارية على عمليات بحث وكيل الذكاء الاصطناعي

الملخص

يتم تلويث تقرير مصطلحات البحث الشائعة بواسطة عناصر نائبة لقالب عنوان URL الخاص بـ OpenSearch (مثل {searchTerms}) التي ليست عمليات بحث حقيقية. هذا يجعل لوحة المعلومات مضللة (غالبًا ما تُظهر {searchTerms} كـ “مصطلح البحث” الأعلى بنسبة نقر إلى ظهور (CTR) تبلغ 0%).

بالإضافة إلى ذلك، مع تزايد التصفح بوساطة الذكاء الاصطناعي، سيكون من المفيد تمييز عمليات البحث التي بدأها وكيل الذكاء الاصطناعي بشكل اختياري بشكل منفصل في تحليلات البحث.


المشكلة 1: ضوضاء عناصر OpenSearch النائبة في سجل البحث (SearchLog)

على موقعي، يظهر {searchTerms} كـ أول مصطلح بحث شائع، مع آلاف الإدخالات ونسبة نقر إلى ظهور تبلغ 0%. تأتي هذه الإدخالات من الزواحف/البرامج الروبوتية (مثل Googlebot و Bingbot، إلخ) التي تزحف إلى /opensearch.xml وتستدعي نقطة نهاية البحث بالسلسلة الحرفية للعنصر النائب بدلاً من استعلام حقيقي.

لقد نوقشت هذه المسألة من قبل:

لكن المصطلحات النائبة لا تزال تظهر في التحليلات.


خطوات التكرار

  1. تمكين/تقديم OpenSearch (على سبيل المثال، /opensearch.xml) للموقع.
  2. السماح للزواحف بالوصول إليه (السلوك العام الافتراضي).
  3. الانتظار حتى تقوم الزواحف بجلب قالب OpenSearch والوصول إلى نقطة نهاية البحث.
  4. عرض المسؤول ← التقارير ← مصطلحات البحث الشائعة.
  5. ملاحظة قيم العناصر النائبة مثل {searchTerms} وهي تهيمن على التقرير.

السلوك المتوقع

يجب ألا يتم تسجيل سلاسل العناصر النائبة/القوالب التي تستخدمها عملاء OpenSearch كعمليات بحث حقيقية ويجب ألا تظهر في مصطلحات البحث الشائعة.


السلوك الفعلي

يتم حفظ سلاسل العناصر النائبة (مثل {searchTerms}) في SearchLog وتظهر كمصطلحات بحث حقيقية، مما يلوث التحليلات.


الإصلاح المقترح

قم بتصفية سلاسل العناصر النائبة المعروفة لـ OpenSearch قبل تسجيلها في SearchLog، على سبيل المثال:

  • {searchTerms}
  • {search_term_string}

(إذا كانت هناك متغيرات شائعة أخرى، فإن إضافتها ستكون مناسبة أيضًا.)
هذا في الواقع “ضوضاء روبوتية”، وليس استعلامًا بشريًا شرعيًا أبدًا، وهو يفسد فائدة التقرير.


فرصة أكبر: تحليلات البحث في عصر الذكاء الاصطناعي (اختياري / متوسط إلى طويل الأجل)

تسلط مشكلة {searchTerms} الضوء على فجوة أوسع: نسبة متزايدة من عمليات البحث تتم بواسطة وكلاء الذكاء الاصطناعي نيابة عن المستخدمين (على سبيل المثال، عندما يطلب المستخدم من مساعد “البحث في هذا المنتدى عن س”). يمكن أن تمثل عمليات البحث هذه نية المستخدم الحقيقية، ولكنها حاليًا مختلطة مع جميع حركة المرور الأخرى ويصعب فهمها.

المدى المتوسط (اختياري)

تمييز عمليات البحث التي يُحتمل أن يكون وكلاء الذكاء الاصطناعي قد بدأوها باستخدام استدلالات User-Agent (أمثلة فقط):

  • تصفح ChatGPT / متغيرات وكيل العميل
  • روبوتات Perplexity
  • الوكلاء المتعلقون بـ Claude
  • وكلاء Google المتعلقون بالذكاء الاصطناعي (مثل GoogleOther، إلخ)

لن يحتاج هذا إلى أن يكون مثاليًا - فقط جيدًا بما يكفي لإعطاء المسؤولين رؤية.

المدى الطويل (اختياري)

إضافة عامل تصفية/علامة تبويب “بحث الذكاء الاصطناعي” في تقرير مصطلحات البحث الشائعة حتى يتمكن المسؤولون من رؤية:

  • عمليات بحث بشرية
  • عمليات بحث وكيل الذكاء الاصطناعي
  • الكل مدمج

لماذا هذا مهم

  • تلوث العناصر النائبة يجعل لوحة المعلومات أقل موثوقية ويمكن أن يهيمن على “الشائع”.
  • لا ينبغي للمسؤولين تنظيف التحليلات يدويًا أو تجاهل الإدخالات العليا المعطلة.
  • حركة مرور البحث بوساطة الذكاء الاصطناعي في تزايد، ويستفيد أصحاب المواقع من الرؤية في تلك النوايا.