Problemi di ricerca in v2.3

Hello,

I’ve upgraded our Discourse instance from 2.2.6 to 2.3. Unfortunately we’ve noticed some issues with search:

  • the result contains mostly totally unrelated posts (many posts don’t have the search phrase)
  • the search ignores the options (like Matching in title only)

It shows up with terms containing accent like Hungarian word “tészta” :slight_smile: Ignore accents when searching for text. in admin settings is unchecked.

If you ever amend the site setting search ignore accents you must rebuild the full search index with:

./launcher enter app
rake search:reindex

Thanks for the hint! Unfortunately it doesn’t solve the problem :frowning:

It’s quite weird that some pre-2.3 posts contain search URLs (some has multi-word search terms with different accents) which are working fine and return valid result while new search queries are not working and give back not relevant posts.

Nessuno ha mai incontrato questo problema? :fearful:

Purtroppo gli accenti non possono essere ignorati, perché ciò porterebbe a risultati inaccurati. Dove dovrei cercare per risolvere questo problema? Forse tornando alla versione 2.2 (sarebbe solo una soluzione temporanea, però :frowning: )?

Qualsiasi idea è benvenuta!

Ancora non capisco il problema.

Incolla qui un estratto esatto di testo con il comportamento che ti aspetteresti. Possiamo quindi testarlo in locale.

Termina di ricerca: “kávé in:title” (non funziona nemmeno senza in:title)

Un estratto dai risultati:

  • Szezámos káposzta
  • Káposztás lepény
  • A káromkodásról és csúnya beszédről
  • Diós, csokis masala kávé
  • Káposztás pizza
  • Kávékoncentrátum házilag

Il risultato corretto dovrebbe essere:

  • Diós, csokis masala kávé
  • Diós, tejes kávé
  • Kávékoncentrátum házilag

Oltre ai risultati irrilevanti, alcuni risultati validi non sono affatto elencati.

Grazie mille!

E confermi al 100% che l’opzione ‘search ignore accents’ nelle impostazioni del sito è deselezionata e che hai eseguito un reindicizzazione dopo averla deselezionata?

Ho eseguito la reindicizzazione dopo il tuo post e è stata completata senza problemi.

Ci sono aggiornamenti su questo problema?

Ho appena fatto una prova su try.discourse.org e ho creato 5 argomenti con i titoli che hai fornito.

Poi ho cercato “kávé in:title” e ho ottenuto questi risultati

Che a me sembrano corretti :man_shrugging:

Puoi mostrarci l’elenco di tutte le impostazioni del sito che hai modificato?
(:warning: assicurati però di rimuovere tutti i valori sensibili)

Grazie per aver indagato su questo problema :+1:

La personalizzazione è stata omessa; ci sono solo immagini.

Appena provato in locale con la locale predefinita impostata su "`magyar`` e funziona anche così

Puoi assicurarti di aggiornare all’ultima versione e riprovare?

Sì, ma purtroppo non ha funzionato :frowning:

Ho eseguito una nuova installazione locale e “kávé” ha funzionato correttamente, ma alcune altre parole no. Sembra che il problema sia legato alla ricerca full text in PostgreSQL e a come viene analizzato il testo. Ad esempio, dalla parola di ricerca “kávé” si ottiene “ká” dopo la normalizzazione, e questa forma normalizzata viene confrontata con il testo, quindi sia “vé” che “poszta” sono risultati corretti per la FTS :slight_smile:

Spero che la situazione migliorerà con l’uso dei dizionari Hunspell in PostgreSQL, ma al momento quello ungherese è rotto :sob: