La recherche doit faire correspondre les caractères fantaisistes avec leur équivalent "régulier"

J’ai copié-collé un titre de sujet (tel qu’affiché, avec des entités stylisées) dans la recherche :
New Lowe's commercial with UniGeezer

Aucun résultat :

J’ai remplacé l’apostrophe stylisée par l’apostrophe « classique » dans le champ de recherche :
New Lowe's commercial with UniGeezer

Le sujet apparaît maintenant.

Ma suggestion est que la recherche doive associer chaque caractère stylisé à son équivalent original.

8 « J'aime »

Bonne remarque, comment devrions-nous gérer cela @sam ?

3 « J'aime »

Que dire des diacritiques ?

Nous avons déjà une certaine normalisation pour les diacritiques, donc nous pourrions peut-être aussi corriger cela de manière similaire.

@tgxworld peut y réfléchir.

3 « J'aime »

@Canapin Pouvez-vous toujours reproduire ce problème ? J’ai essayé de le reproduire localement, mais sans succès. L’apostrophe est supprimée des données de recherche, elle ne devrait donc avoir aucun effet sur la recherche.

discourse_development=# SELECT TO_TSVECTOR('english', 'New Lowe’s commercial with UniGeezer') @@ PLAINTO_TSQUERY('english', 'New Lowe’s commercial with UniGeezer');
 ?column? 
----------
 t
(1 row)

Pourriez-vous m’indiquer le site où vous rencontrez ce problème afin que je puisse obtenir une reproduction ? Merci !

1 « J'aime »

Je rencontre toujours le problème, et cela se produit lorsque je recherche la chaîne exacte (entourée de ") :

https://unicyclist.com/search?q=%22New%20Lowe%E2%80%99s%20commercial%20with%20UniGeezer%22

par rapport à

https://unicyclist.com/search?q=%22New%20Lowe%27s%20commercial%20with%20UniGeezer%22

1 « J'aime »

Merci pour le rapport. Cela affecte essentiellement la recherche de termes exacts lorsque les termes de recherche sont entourés de ". Le problème ici est que le vrai titre du sujet est en fait New Lowe's commercial with UniGeezer, mais le titre stylisé est New Lowe’s commercial with UniGeezer. Lors d’une recherche de termes exacts, nous ne faisons correspondre les termes donnés qu’au titre du sujet et non au titre stylisé.

La difficulté réside dans le fait que nous ne pouvons pas remplacer par ' sans condition, car un titre de sujet contenant finirait par ne pas correspondre. Je ne suis pas vraiment sûr de ce que nous pouvons faire ici, car nous affichons des caractères différents côté client lors de l’affichage du titre du sujet.

@gerhard @sam Il semble que vous ayez déjà abordé ce problème lié aux guillemets. Avez-vous des idées sur ce que nous pouvons faire ici ? Pour être honnête, c’est un cas limite qui n’affectera qu’une très petite partie des requêtes de recherche. Je suis plutôt enclin à simplement ignorer le problème.

1 « J'aime »

Ce n’est pas une blague ! :stuck_out_tongue_winking_eye:

Je suppose que nous pourrions normaliser en ' dans l’index et le terme de recherche. Mais honnêtement, je ne suis pas sûr que cela vaille la peine de déployer un effort colossal pour corriger cela.

1 « J'aime »

Ceci n’est pas lié à l’index de recherche. Pour les correspondances exactes, nous le comparons à Post#raw et Topic#title :

1 « J'aime »

Je vois, oui… aucune solution facile ici du tout, je pense que c’est juste un détail avec lequel il faut vivre.

2 « J'aime »