Problèmes de recherche dans v2.3

Hello,

I’ve upgraded our Discourse instance from 2.2.6 to 2.3. Unfortunately we’ve noticed some issues with search:

  • the result contains mostly totally unrelated posts (many posts don’t have the search phrase)
  • the search ignores the options (like Matching in title only)

It shows up with terms containing accent like Hungarian word “tészta” :slight_smile: Ignore accents when searching for text. in admin settings is unchecked.

If you ever amend the site setting search ignore accents you must rebuild the full search index with:

./launcher enter app
rake search:reindex

Thanks for the hint! Unfortunately it doesn’t solve the problem :frowning:

It’s quite weird that some pre-2.3 posts contain search URLs (some has multi-word search terms with different accents) which are working fine and return valid result while new search queries are not working and give back not relevant posts.

Personne n’a rencontré ce problème ? :fearful:

Malheureusement, on ne peut pas ignorer les accents, car cela entraînerait des résultats inexacts. Où devrais-je chercher pour résoudre ce problème ? Peut-être en revenant à la version 2.2 (ce ne serait qu’une solution temporaire, hélas :frowning: ) ?

Toute idée est la bienvenue !

Je ne comprends toujours pas le problème.

Postez un extrait exact du texte ici, ainsi que le comportement que vous attendez. Nous pourrons alors le tester localement.

Terme de recherche : « kávé in:title » (cela ne fonctionne pas non plus sans in:title)

Un extrait des résultats :

  • Szezámos káposzta
  • Káposztás lepény
  • A káromkodásról és csúnya beszédről
  • Diós, csokis masala kávé
  • Káposztás pizza
  • Kávékoncentrátum házilag

Le résultat correct devrait être :

  • Diós, csokis masala kávé
  • Diós, tejes kávé
  • Kávékoncentrátum házilag

En plus des résultats non pertinents, certains résultats valides ne sont pas du tout répertoriés.

Merci beaucoup !

Et vous confirmez à 100 % que l’option « ignorer les accents dans la recherche » dans les paramètres du site est décochée et que vous avez effectué une réindexation après avoir décoché cette option ?

J’ai effectué la réindexation comme vous l’avez mentionné dans votre message, et elle s’est déroulée sans aucun problème.

Une mise à jour sur ce problème ?

Je viens de tester sur try.discourse.org et j’ai créé 5 sujets avec les titres que vous avez fournis.

Ensuite, j’ai recherché « kávé in:title » et voici les résultats obtenus :

Ce qui me semble correct :man_shrugging:

Pouvez-vous nous montrer la liste de tous les paramètres du site que vous avez modifiés ?
(:warning: Assurez-vous cependant de masquer toutes les valeurs sensibles)

Merci d’avoir examiné ce problème :+1:

La personnalisation a été omise, il n’y a que des images.

Je viens de tester localement avec la langue par défaut définie sur « magyar » et cela fonctionne également.

Pouvez-vous vous assurer que vous avez mis à jour vers la dernière version et vérifier à nouveau ?

Oui, mais malheureusement cela n’a pas aidé :frowning:

J’ai effectué une installation locale fraîche et « kávé » a fonctionné correctement, mais certains autres mots non. Il semble que le problème soit lié à la recherche en texte intégral dans PostgreSQL et à la façon dont le texte est analysé. Par exemple, à partir du mot de recherche « kávé », on obtient « ká » après normalisation, et cette forme normalisée est comparée au texte, donc « vé » et « poszta » sont tous deux des résultats corrects pour la recherche en texte intégral :slight_smile:

J’espère que la situation s’améliorera avec l’utilisation des dictionnaires Hunspell dans PostgreSQL, mais pour l’instant, celui pour le hongrois est cassé :sob: