Résumé
Le rapport Termes de recherche tendances est pollué par des espaces réservés de modèles d’URL OpenSearch (par exemple, {searchTerms}) qui ne sont pas de véritables recherches. Cela rend le tableau de bord trompeur (affichant souvent {searchTerms} comme le « terme de recherche » principal avec un CTR de 0 %).
De plus, à mesure que la navigation médiatisée par l’IA augmente, il serait utile d’étiqueter facultativement les recherches initiées par des agents IA séparément dans les analyses de recherche.
Problème 1 : Bruit des espaces réservés OpenSearch dans SearchLog
Sur mon site, {searchTerms} apparaît comme le terme de recherche tendance n°1, avec des milliers d’entrées et un CTR de 0 %. Ces entrées proviennent de robots d’exploration/bots (par exemple, Googlebot, Bingbot, etc.) qui explorent /opensearch.xml et appellent le point de terminaison de recherche avec la chaîne d’espace réservé littérale au lieu d’une véritable requête.
Ceci a déjà été discuté :
Mais les termes de l’espace réservé apparaissent toujours dans les analyses.
Étapes pour reproduire
- Activer/servir OpenSearch (par exemple,
/opensearch.xml) pour le site - Permettre aux robots d’exploration d’y accéder (comportement public par défaut)
- Attendre que les robots d’exploration récupèrent le modèle OpenSearch et accèdent au point de terminaison de recherche
- Consulter Admin → Rapports → Termes de recherche tendances
- Observer les valeurs d’espace réservé comme
{searchTerms}dominant le rapport
Comportement attendu
Les chaînes d’espace réservé/modèle utilisées par les clients OpenSearch ne doivent pas être enregistrées comme de véritables recherches et ne doivent pas apparaître dans les Termes de recherche tendances.
Comportement actuel
Les chaînes d’espace réservé (par exemple, {searchTerms}) sont enregistrées dans SearchLog et apparaissent comme de véritables termes de recherche, polluant les analyses.
Correction proposée
Filtrer les chaînes d’espace réservé OpenSearch connues avant de les enregistrer dans SearchLog, par exemple :
{searchTerms}{search_term_string}
(S’il existe d’autres variantes courantes, les ajouter serait acceptable aussi.)
Ceci est effectivement du « bruit de bot », jamais une requête humaine légitime, et cela nuit à l’utilité du rapport.
Opportunité plus large : analyses de recherche à l’ère de l’IA (Facultatif / Moyen-Long terme)
Le problème {searchTerms} met en évidence une lacune plus large : une part croissante des recherches est effectuée par des agents IA au nom des utilisateurs (par exemple, lorsqu’un utilisateur demande à un assistant « rechercher ceci sur le forum pour X »). Ces recherches peuvent représenter une intention réelle de l’utilisateur, mais actuellement, elles sont mélangées à tout autre trafic et difficiles à comprendre.
Moyen terme (Facultatif)
Étiqueter les recherches probablement initiées par des agents IA à l’aide d’heuristiques User-Agent (exemples uniquement) :
- Variantes d’agent/de navigation ChatGPT
- Robots Perplexity
- Agents liés à Claude
- UAs liés à Google AI (par exemple,
GoogleOther, etc.)
Cela n’a pas besoin d’être parfait, juste assez bon pour donner de la visibilité aux administrateurs.
Long terme (Facultatif)
Ajouter un filtre/onglet « Recherche IA » dans le rapport Termes de recherche tendances afin que les administrateurs puissent voir :
- Recherches humaines
- Recherches d’agents IA
- Tout combiné
Pourquoi c’est important
- La pollution par les espaces réservés rend le tableau de bord moins fiable et peut dominer les « Tendances »
- Les administrateurs ne devraient pas avoir à nettoyer manuellement les analyses ou à ignorer les premières entrées cassées
- Le trafic de recherche médiatisé par l’IA augmente, et les propriétaires de sites bénéficient d’une visibilité sur ces intentions