Come indagare sul traffico bot utilizzando Google Analytics

Indagare sul traffico sospetto di bot utilizzando Google Analytics

Questa guida fornisce un processo passo passo per utilizzare Google Analytics 4 (GA4) per aiutare a identificare e indagare sull’attività sospetta di bot.

1. Comprendere il filtraggio automatico dei bot di GA4

GA4 esclude automaticamente il traffico da bot e spider noti per impostazione predefinita.[1] Questo filtraggio si basa sulla ricerca di Google e sull’elenco internazionale di spider e bot (International Spiders & Bots List) dell’IAB.

I passaggi di questa guida sono pensati per aiutarti a identificare bot più sofisticati o sconosciuti che potrebbero non essere presenti in questo elenco.

2. Analizzare il traffico per pattern insoliti

I bot generano spesso traffico che si discosta significativamente dai tuoi tipici pattern utente.

Passaggi:

  1. Controlla i report in tempo reale:

    • Vai su Report > Pagine in tempo reale. Cerca picchi improvvisi e inspiegabili in “Utenti attivi negli ultimi 30 minuti”. Questo può essere il primo segnale di un aumento dell’attività dei bot.
    • :warning: Se pensi che il tuo sito sia sotto attacco spam, usa la nostra guida su Immediate actions you can take during a spam attack
  2. Indagare sulla posizione geografica:

    • Vai su Report > Dati demografici > Utente > Attributi utente > Dettagli demografici.
    • Il grafico predefinito mostrato dovrebbe essere Dettagli demografici: Paese. Cerca un numero elevato di utenti da paesi che non targettizzi, dove non hai una presenza aziendale o dove tipicamente non hai ricevuto molto traffico. Un improvviso aumento da una singola località inaspettata è un importante campanello d’allarme.
  3. Analizzare le origini del traffico per lo spam di referral:

    • Vai su Report > Acquisizione > Acquisizione traffico.
    • Il report è impostato per impostazione predefinita su “Gruppo di canali predefinito sessione”. Fai clic sulla freccia a discesa accanto alla dimensione primaria e seleziona Origine sessione / mezzo. Scansiona alla ricerca di origini di referral sospette o insensate (ad esempio, \"free-traffic-seo.com,\" “buttons-for-your-website.com”). Questi sono segni classici di spam di referral[2].

3. Esaminare le metriche di comportamento degli utenti

Le metriche comportamentali potrebbero essere lo strumento più potente di GA4 per separare gli utenti umani dai bot.

Passaggi:

  1. Cerca un basso tempo di coinvolgimento:

    • Vai su Report > Coinvolgimento > Pagine e schermate.
    • :information_source: In GA4, il Tasso di coinvolgimento è la percentuale di sessioni che sono durate più di 10 secondi, hanno avuto un evento di conversione o hanno avuto almeno 2 visualizzazioni di pagina. Questa è una visione più sfumata della sessione rispetto alla loro precedente misurazione del “tasso di rimbalzo”.
    • La metrica Tempo medio di coinvolgimento mostra per quanto tempo il tuo sito è stato in primo piano per gli utenti. I bot tipicamente trascorrono pochissimo tempo su una pagina. Ordina la tabella per “Tempo medio di coinvolgimento” (crescente) per trovare pagine con un coinvolgimento insolitamente basso nonostante visualizzazioni significative.
    • Cerca pagine con un alto numero di “Visualizzazioni” ma un “Tasso di coinvolgimento” molto basso. Ciò indica che gli utenti atterrano sulla pagina e se ne vanno immediatamente, un comportamento comune dei bot.
    • :information_source: Se non vedi la colonna “Tasso di coinvolgimento”, dovrai aggiungerla. Fai clic sull’icona della matita (Personalizza report) nell’angolo in alto a destra, seleziona “Metriche” e aggiungi “Tasso di coinvolgimento” al report. Ricorda di salvare le modifiche.
  2. Controlla le pagine di destinazione:

    • Vai su Report > Coinvolgimento > Pagina di destinazione.
    • Nella navigazione a sinistra, vai su Report > Coinvolgimento > Pagina di destinazione. Cerca pagine con un numero elevato di Nuovi utenti ma un Tempo medio di coinvolgimento estremamente basso. Questo pattern suggerisce traffico automatizzato che colpisce punti di ingresso specifici del tuo sito e se ne va subito.

4. Cosa Google Analytics non può dirti :frowning:

  • Indirizzi IP: Come Google Search Console, Google Analytics non riporta gli indirizzi IP degli utenti. Queste informazioni si trovano solo nei log del tuo server. L’analisi dei log del server è fondamentale per bloccare gli IP dannosi.

Conclusione

Sebbene Google Analytics possa essere utile nell’identificare pattern di traffico sospetti, per rallentare o bloccare i crawler indesiderati su un forum Discourse, dovrai modificare alcune delle impostazioni che troverai cercando crawler in Amministrazione > Impostazioni del sito.

Per i bot che scegli di bloccare completamente, aggiungi il loro user agent a Blocked crawler user agents (User agent dei crawler bloccati). Per i bot meno aggressivi, ma comunque intensivi in termini di risorse, puoi aggiungerli a Slow down crawler user agents (Rallenta user agent dei crawler) per ridurne la velocità di scansione senza bloccarli del tutto. Puoi gestire la velocità del rallentamento tramite l’impostazione del sito Slow down crawler rate (Velocità di rallentamento crawler).

:warning: Fai molta attenzione quando apporti modifiche a queste impostazioni. Ad esempio, alcuni proprietari di siti hanno accidentalmente bloccato tutto il traffico dai motori di ricerca legittimi configurando erroneamente questa impostazione.

Infine, ricorda che queste misure non sono infallibili. I crawler sono in continua evoluzione e potrebbero non comportarsi bene; potrebbero cambiare le loro stringhe user agent o distribuire le richieste su più indirizzi IP per aggirare questi limiti. Pertanto, sebbene queste impostazioni possano fornire una solida prima linea di difesa, dovresti continuare a monitorare le tue analisi e i log del server per pattern nuovi o insoliti.


  1. [GA4] Known bot-traffic exclusion - Analytics Help ↩︎

  2. Referrer spam - Wikipedia ↩︎