La ricerca dovrebbe corrispondere a caratteri speciali con il loro equivalente "normale"

Ho incollato il titolo di un argomento (così come viene visualizzato, con entità speciali) nella ricerca:
New Lowe's commercial with UniGeezer

Nessun risultato:

Ho sostituito l’apostrofo speciale con quello “normale” nel campo di ricerca:
New Lowe's commercial with UniGeezer

Ora l’argomento appare.

Il mio suggerimento è che la ricerca dovrebbe corrispondere ogni carattere speciale con quello originale.

8 Mi Piace

Buon punto, come dovremmo gestire questa cosa @sam?

3 Mi Piace

E i diacritici?

Abbiamo già una normalizzazione per i diacritici, quindi forse possiamo correggere anche questo con un approccio simile.

@tgxworld può pensarci.

3 Mi Piace

@Canapin Riesci ancora a riprodurre questo problema? Ho provato a riprodurlo localmente ma non ci sono riuscito. L’apostrofo viene rimosso dai dati di ricerca, quindi non dovrebbe avere alcun effetto sulla ricerca.

discourse_development=# SELECT TO_TSVECTOR('english', 'New Lowe’s commercial with UniGeezer') @@ PLAINTO_TSQUERY('english', 'New Lowe’s commercial with UniGeezer');
 ?column? 
----------
 t
(1 row)

Puoi indicarmi il sito in cui stai riscontrando questo problema in modo che possa riprodurlo? Grazie!

1 Mi Piace

Ho ancora lo stesso problema, e si verifica quando cerco la stringa esatta (racchiusa tra "):

https://unicyclist.com/search?q=%22New%20Lowe%E2%80%99s%20commercial%20with%20UniGeezer%22

rispetto a

https://unicyclist.com/search?q=%22New%20Lowe%27s%20commercial%20with%20UniGeezer%22

1 Mi Piace

Grazie per la segnalazione. Questo influisce essenzialmente sulla ricerca di termini esatti quando i termini di ricerca sono racchiusi in ". Il problema è che il titolo reale dell’argomento è effettivamente New Lowe's commercial with UniGeezer, mentre il titolo stilizzato è New Lowe’s commercial with UniGeezer. Quando eseguiamo una ricerca per termini esatti, confrontiamo i termini forniti solo con il titolo dell’argomento e non con quello stilizzato.

La difficoltà qui è che non possiamo semplicemente sostituire con ' incondizionatamente, perché un titolo di argomento contenente finirebbe per non corrispondere. Sono un po’ incerto su cosa possiamo fare, dato che stiamo visualizzando caratteri diversi sul lato client quando mostriamo il titolo dell’argomento.

@gerhard @sam Sembra che abbiate già affrontato questo problema relativo alle citazioni in passato; avete idee su cosa possiamo fare in questo caso? A dire il vero, però, si tratta di un caso limite che influenzerà una percentuale molto ridotta di query di ricerca. Sono propenso a lasciar perdere.

1 Mi Piace

Questa non è una cosa da ridere! :stuck_out_tongue_winking_eye:

Immagino che potremmo normalizzare in ' nell’indice e nel termine di ricerca. Ma onestamente non sono sicuro che valga la pena fare uno sforzo enorme per risolvere questo problema.

1 Mi Piace

Questo non è correlato all’indice di ricerca. Per le corrispondenze esatte, lo confrontiamo con Post#raw e Topic#title:

1 Mi Piace

Capisco, sì… non c’è affatto una soluzione semplice qui, penso che sia solo un piccolo inconveniente con cui dobbiamo convivere.

2 Mi Piace