Cómo investigar el tráfico de bots usando Google Analytics

Investigue el tráfico sospechoso de bots utilizando Google Analytics

Esta guía proporciona un proceso paso a paso para utilizar Google Analytics 4 (GA4) para ayudar a identificar e investigar la actividad sospechosa de bots.

1. Comprender el filtrado de bots predeterminado de GA4

GA4 excluye automáticamente el tráfico de bots y arañas conocidos de forma predeterminada.[1] Este filtrado se basa en la investigación de Google y la Lista Internacional de Arañas y Bots de la IAB.

Los pasos de esta guía están diseñados para ayudarle a identificar bots más sofisticados o desconocidos que pueden no estar en esta lista.

2. Analizar el tráfico en busca de patrones inusuales

Los bots a menudo generan tráfico que se desvía significativamente de sus patrones de usuario habituales.

Pasos:

  1. Consultar informes en tiempo real:

    • Vaya a Informes > Páginas en tiempo real. Busque picos repentinos e inexplicables en “Usuarios activos en los últimos 30 minutos”. Este puede ser el primer signo de un aumento activo de bots.

    > :warning: Si cree que su sitio está bajo un ataque de spam, utilice nuestra guía en Immediate actions you can take during a spam attack

  2. Investigar la ubicación geográfica:

    • Vaya a Informes > Demografía > Usuario > Atributos del usuario > Detalles demográficos.

    • El gráfico predeterminado que se muestra debe ser Detalles demográficos: País. Busque un gran número de usuarios de países a los que no se dirige, donde no tiene presencia comercial o donde normalmente no ha recibido mucho tráfico. Un aumento repentino de una ubicación única e inesperada es una gran señal de alerta.

  3. Analizar las fuentes de tráfico en busca de spam de referencia:

    • Vaya a Informes > Adquisición > Adquisición de tráfico.

    • El informe se muestra por defecto como “Grupo de canales predeterminado de la sesión”. Haga clic en la flecha desplegable junto a la dimensión principal y seleccione Fuente/medio de la sesión. Busque fuentes de referencia sospechosas o sin sentido (por ejemplo, \"free-traffic-seo.com,\" “buttons-for-your-website.com”). Estos son signos clásicos de spam de referencia[2].

3. Examinar las métricas de comportamiento del usuario

Las métricas de comportamiento pueden ser la herramienta más potente de GA4 para separar a los usuarios humanos de los bots.

Pasos:

  1. Buscar un tiempo de interacción bajo:

    • Vaya a Informes > Interacción > Páginas y pantallas.

    > :information_source: En GA4, la Tasa de interacción es el porcentaje de sesiones que duraron más de 10 segundos, tuvieron un evento de conversión o tuvieron al menos 2 visitas a páginas. Esta es una visión más matizada de la sesión que su anterior medición de “tasa de rebote”.

    • La métrica Tiempo medio de interacción muestra cuánto tiempo estuvo su sitio en primer plano para los usuarios. Los bots suelen pasar muy poco tiempo en una página. Ordene la tabla por “Tiempo medio de interacción” (ascendente) para encontrar páginas con una interacción inusualmente baja a pesar de tener vistas significativas.

    • Busque páginas con un alto número de “Visitas” pero una “Tasa de interacción” muy baja. Esto indica que los usuarios llegan a la página y se van inmediatamente, un comportamiento común de los bots.

    > :information_source: Si no ve la columna “Tasa de interacción”, deberá añadirla. Haga clic en el icono del lápiz (Personalizar informe) en la esquina superior derecha, seleccione “Métricas” y añada “Tasa de interacción” al informe. Recuerde guardar sus cambios.

  2. Consultar las páginas de destino:

    • Vaya a Informes > Interacción > Página de destino.

    • En la navegación de la izquierda, vaya a Informes > Interacción > Página de destino. Busque páginas con un gran número de Usuarios nuevos pero un Tiempo medio de interacción extremadamente bajo. Este patrón sugiere tráfico automatizado que llega a puntos de entrada específicos de su sitio y se va de inmediato.

4. Lo que Google Analytics no puede decirle :frowning:

  • Direcciones IP: Al igual que Google Search Console, Google Analytics no informa sobre las direcciones IP de los usuarios. Esta información solo se puede encontrar en los registros de su servidor. El análisis de los registros del servidor es fundamental para bloquear las IP maliciosas.

Conclusión

Si bien Google Analytics puede ser útil para identificar patrones de tráfico sospechosos, para ralentizar o bloquear rastreadores no deseados en un foro de Discourse, deberá ajustar algunas de las configuraciones que encontrará al buscar crawler en Administración > Configuración del sitio.

Para los bots que elija bloquear por completo, añada su agente de usuario a Agentes de usuario de rastreadores bloqueados. Para bots menos agresivos, pero que consumen muchos recursos, puede añadirlos a Ralentizar agentes de usuario de rastreadores para reducir su velocidad de rastreo sin bloquearlos por completo. Puede gestionar la velocidad de la ralentización a través de la configuración del sitio Velocidad de rastreadores lentos.

> :warning: Tenga mucho cuidado al realizar ajustes en estas configuraciones. Por ejemplo, algunos propietarios de sitios han bloqueado accidentalmente todo el tráfico de motores de búsqueda legítimos al configurar incorrectamente esta opción.

Finalmente, recuerde que estas medidas no son infalibles. Los rastreadores evolucionan constantemente y pueden no comportarse bien; pueden cambiar sus cadenas de agente de usuario o distribuir solicitudes entre múltiples direcciones IP para eludir estos límites. Por lo tanto, si bien estas configuraciones pueden proporcionar una sólida primera línea de defensa, debe seguir supervisando sus análisis y los registros de su servidor en busca de patrones nuevos o inusuales.


  1. [GA4] Known bot-traffic exclusion - Analytics Help ↩︎

  2. Referrer spam - Wikipedia ↩︎