Dies ist eine SQL-Version des Dashboard-Berichts für Web-Crawler-User-Agents.
Dieser Dashboard-Bericht listet die Top-Web-Crawler-User-Agents auf, sortiert nach Seitenaufrufen, und gibt Einblicke, welche Crawler auf einer Website am aktivsten sind.
--[params]
-- date :start_date = 2024-01-06
-- date :end_date = 2024-02-07
SELECT
user_agent,
SUM(count) AS pageviews
FROM web_crawler_requests
WHERE date BETWEEN :start_date AND :end_date
GROUP BY user_agent
ORDER BY pageviews DESC
Erklärung der SQL-Abfrage
- Parameter: Die Abfrage akzeptiert zwei Parameter,
:start_dateund:end_date, die den Zeitraum für den Bericht definieren. Beide Datumsparameter akzeptieren das FormatJJJJ-MM-TT. - SELECT: Die Abfrage ruft Daten aus der Tabelle
web_crawler_requestsab, die Anfragen von Web-Crawlern an das Forum protokolliert. Jeder Datensatz in dieser Tabelle enthält denuser_agentdes Crawlers und einecountvon Seitenaufrufen. - SUM: Die Funktion
SUM(count)berechnet die Gesamtzahl der Seitenaufrufe für jedenuser_agentinnerhalb des angegebenen Datumsbereichs. - Filterung: Die Klausel
WHEREfiltert Datensätze, um nur diejenigen einzuschließen, die in den angegebenen Datumsbereich fallen, und verwendet die Spaltedate. - Aggregation: Die Klausel
GROUP BYgruppiert die Ergebnisse nachuser_agent, um sicherzustellen, dass die Daten für jeden Web-Crawler einzeln zusammengefasst werden. - Sortierung: Die Klausel
ORDER BYsortiert die Ergebnisse in absteigender Reihenfolge vonpageviews, wodurch die aktivsten Web-Crawler am Anfang des Berichts platziert werden.
Datensätze aus der Tabelle
web_crawler_requestswerden automatisch nach 30 Tagen gelöscht. Ergebnisse für diesen Bericht sind nur für die letzten 30 Tage ab dem Zeitpunkt der Berichterstellung verfügbar. Sie können die Datenparameter für diese Abfrage jedoch weiterhin verwenden, um Ergebnisse innerhalb der letzten 30 Tage zu filtern.
Beispielergebnisse
| user_agent | pageviews |
|---|---|
| Mozilla/5.0 (compatible; SeekportBot; +https://bot.seekport.com) | 1406 |
| Mozilla/5.0 (compatible; YandexBot/3.0; +http://yandex.com/bots) | 724 |
| Mozilla/5.0 (compatible; DataForSeoBot/1.0; +https://dataforseo.com/dataforseo-bot) | 533 |
| … | … |

