Questo è una versione SQL del Report della Dashboard per User Agent di Web Crawler.
Questo Report della Dashboard elenca i principali user agent di web crawler, ordinati per pageview, fornendo informazioni su quali crawler sono più attivi su un sito.
--[params]
-- date :start_date = 2024-01-06
-- date :end_date = 2024-02-07
SELECT
user_agent,
SUM(count) AS pageviews
FROM web_crawler_requests
WHERE date BETWEEN :start_date AND :end_date
GROUP BY user_agent
ORDER BY pageviews DESC
Spiegazione della Query SQL
- Parametri: La query accetta due parametri,
:start_datee:end_date, che definiscono l’intervallo di tempo per il report. Entrambi i parametri di data accettano il formatoAAAA-MM-GG. - SELECT: La query recupera i dati dalla tabella
web_crawler_requests, che registra le richieste effettuate dai web crawler al forum. Ogni record in questa tabella include louser_agentdel crawler e uncountdi pageview. - SUM: La funzione
SUM(count)calcola il numero totale di pageview per ciascunuser_agentnell’intervallo di date specificato. - Filtraggio: La clausola
WHEREfiltra i record per includere solo quelli che rientrano nell’intervallo di date specificato, utilizzando la colonnadate. - Aggregazione: La clausola
GROUP BYraggruppa i risultati peruser_agent, assicurando che i dati siano riassunti per ciascun web crawler individualmente. - Ordinamento: La clausola
ORDER BYordina i risultati in ordine decrescente dipageviews, posizionando i web crawler più attivi in cima al report.
I record dalla tabella web_crawler_requests vengono automaticamente eliminati dopo 30 giorni. I risultati per questo report sono disponibili solo per gli ultimi 30 giorni da quando viene eseguito il report, tuttavia, è ancora possibile utilizzare i parametri di data per questa query per filtrare i risultati negli ultimi 30 giorni.
Risultati di esempio
| user_agent | pageviews |
|---|---|
| Mozilla/5.0 (compatible; SeekportBot; +https://bot.seekport.com) | 1406 |
| Mozilla/5.0 (compatible; YandexBot/3.0; +http://yandex.com/bots) | 724 |
| Mozilla/5.0 (compatible; DataForSeoBot/1.0; +https://dataforseo.com/dataforseo-bot) | 533 |
| … | … |

