هذا هو إصدار SQL من تقرير لوحة المعلومات لعوامل المستخدم الخاصة بالزاحف على الويب.
يسرد تقرير لوحة المعلومات هذا أهم عوامل المستخدم الخاصة بالزاحف على الويب، مرتبة حسب عدد مرات مشاهدة الصفحة، مما يوفر نظرة ثاقبة حول الزواحف الأكثر نشاطًا على موقع ما.
--[params]
-- date :start_date = 2024-01-06
-- date :end_date = 2024-02-07
SELECT
user_agent,
SUM(count) AS pageviews
FROM web_crawler_requests
WHERE date BETWEEN :start_date AND :end_date
GROUP BY user_agent
ORDER BY pageviews DESC
شرح استعلام SQL
- المعلمات: يقبل الاستعلام معلمتين،
:start_dateو:end_date، اللتين تحددان النطاق الزمني للتقرير. تقبل كلتا معلمتي التاريخ تنسيقYYYY-MM-DD. - SELECT: يسترد الاستعلام البيانات من جدول
web_crawler_requests، الذي يسجل الطلبات المقدمة من الزواحف على المنتدى. يتضمن كل سجل في هذا الجدولuser_agentالخاص بالزاحف وcountلعدد مرات مشاهدة الصفحة. - SUM: تحسب الدالة
SUM(count)العدد الإجمالي لمرات مشاهدة الصفحة لكلuser_agentضمن النطاق الزمني المحدد. - التصفية: يقوم شرط
WHEREبتصفية السجلات لتضمين تلك التي تقع ضمن النطاق الزمني المحدد فقط، باستخدام العمودdate. - التجميع: يقوم شرط
GROUP BYبتجميع النتائج حسبuser_agent، مما يضمن تلخيص البيانات لكل زاحف على الويب على حدة. - الفرز: يقوم شرط
ORDER BYبفرز النتائج بترتيب تنازلي لـpageviews، مما يضع الزواحف الأكثر نشاطًا في أعلى التقرير.
يتم تلقائيًا حذف السجلات من جدول web_crawler_requests بعد 30 يومًا. تتوفر النتائج لهذا التقرير فقط خلال الـ 30 يومًا الماضية من وقت تشغيل التقرير، ومع ذلك، لا يزال بإمكانك استخدام معلمات التاريخ لهذا الاستعلام لتصفية النتائج خلال الـ 30 يومًا الماضية.
نتائج مثال
| user_agent | pageviews |
|---|---|
| Mozilla/5.0 (compatible; SeekportBot; +https://bot.seekport.com) | 1406 |
| Mozilla/5.0 (compatible; YandexBot/3.0; +http://yandex.com/bots) | 724 |
| Mozilla/5.0 (compatible; DataForSeoBot/1.0; +https://dataforseo.com/dataforseo-bot) | 533 |
| … | … |

