I log di ricerca dovrebbero ignorare i termini segnaposto di OpenSearch e facoltativamente etichettare le ricerche dell'agente AI

Riepilogo

Il report Termini di ricerca di tendenza è inquinato dai segnaposto dei modelli URL di OpenSearch (ad esempio {searchTerms}) che non sono ricerche reali. Ciò rende la dashboard fuorviante (mostrando spesso {searchTerms} come il “termine di ricerca” principale con CTR dello 0%).

Inoltre, con la crescita della navigazione mediata dall’IA, sarebbe utile contrassegnare facoltativamente le ricerche avviate da agenti IA separatamente nelle analisi di ricerca.


Problema 1: Rumore dei segnaposto di OpenSearch in SearchLog

Sul mio sito, {searchTerms} appare come il termine di ricerca di tendenza n. 1, con migliaia di voci e CTR dello 0%. Queste voci provengono da crawler/bot (ad esempio Googlebot, Bingbot, ecc.) che eseguono la scansione di /opensearch.xml e chiamano l’endpoint di ricerca con la stringa letterale del segnaposto invece di una query reale.

Se n’è già discusso:

Ma i termini segnaposto compaiono ancora nelle analisi.


Passaggi per la Riproduzione

  1. Abilitare/servire OpenSearch (ad esempio /opensearch.xml) per il sito
  2. Consentire ai crawler di accedervi (comportamento pubblico predefinito)
  3. Attendere che i crawler recuperino il modello OpenSearch e raggiungano l’endpoint di ricerca
  4. Visualizzare Admin → Reports → Trending Search Terms (Amministrazione → Report → Termini di ricerca di tendenza)
  5. Osservare i valori segnaposto come {searchTerms} che dominano il report

Comportamento Atteso

Le stringhe segnaposto/modello utilizzate dai client OpenSearch non dovrebbero essere registrate come ricerche reali e non dovrebbero apparire nei Termini di ricerca di tendenza.


Comportamento Attuale

Le stringhe segnaposto (ad esempio {searchTerms}) vengono salvate in SearchLog e appaiono come termini di ricerca reali, inquinando le analisi.


Correzione Proposta

Filtrare le stringhe segnaposto OpenSearch note prima di registrarle in SearchLog, ad esempio:

  • {searchTerms}
  • {search_term_string}

(Se ci sono altre varianti comuni, aggiungerle andrebbe bene.)

Questo è di fatto “rumore di bot”, mai una query umana legittima, e compromette l’utilità del report.


Maggiore Opportunità: Analisi di ricerca nell’era dell’IA (Facoltativo / Medio-Lungo Termine)

Il problema di {searchTerms} evidenzia una lacuna più ampia: una porzione crescente di ricerche viene eseguita da agenti IA per conto degli utenti (ad esempio, quando un utente chiede a un assistente “cerca questo forum per X”). Tali ricerche possono rappresentare l’intento reale dell’utente, ma attualmente sono mescolate con tutto il traffico e difficili da comprendere.

Medio Termine (Facoltativo)

Contrassegnare le ricerche probabilmente avviate da agenti IA utilizzando euristiche User-Agent (solo esempi):

  • Varianti UA di navigazione/agente ChatGPT
  • Bot Perplexity
  • Agenti relativi a Claude
  • UA relativi all’IA di Google (ad esempio, GoogleOther, ecc.)

Non è necessario che sia perfetto, ma sufficiente per dare visibilità agli amministratori.

Lungo Termine (Facoltativo)

Aggiungere un filtro/scheda “Ricerca IA” nel report Trending Search Terms in modo che gli amministratori possano visualizzare:

  • Ricerche umane
  • Ricerche di agenti IA
  • Tutto combinato

Perché è Importante

  • L’inquinamento da segnaposto rende la dashboard meno affidabile e può dominare i “Tendenze”
  • Gli amministratori non dovrebbero dover pulire manualmente le analisi o ignorare le voci principali errate
  • Il traffico di ricerca mediato dall’IA è in aumento e i proprietari dei siti traggono vantaggio dalla visibilità su tali intenti