Die Suche sollte Sonderzeichen mit ihrem "normalen" Äquivalent abgleichen

Ich habe einen Beitragstitel (so wie er angezeigt wird, mit speziellen Zeichen) in die Suche kopiert und eingefügt:
New Lowe’s commercial with UniGeezer

Kein Ergebnis:

Ich habe das spezielle Apostroph im Suchfeld durch das „normale

8 „Gefällt mir“

Guter Punkt, wie sollten wir das handhaben, @sam?

3 „Gefällt mir“

Was ist mit Diakritika?

Wir haben bereits eine Normalisierung für Diakritika, also können wir dies vielleicht auf einem ähnlichen Weg korrigieren.

@tgxworld kann sich das einmal ansehen.

3 „Gefällt mir“

@Canapin, kannst du das immer noch reproduzieren? Ich habe versucht, das lokal nachzustellen, konnte es aber nicht. Das Apostroph wird aus den Suchdaten entfernt, sodass es keinen Einfluss auf die Suche haben sollte.

discourse_development=# SELECT TO_TSVECTOR('english', 'New Lowe’s commercial with UniGeezer') @@ PLAINTO_TSQUERY('english', 'New Lowe’s commercial with UniGeezer');
 ?column? 
----------
 t
(1 row)

Kannst du mir die Website nennen, bei der du auf dieses Problem stößt, damit ich eine Reproduktion durchführen kann? Vielen Dank!

1 „Gefällt mir“

Das Problem besteht weiterhin, und zwar beim Suchen nach der exakten Zeichenkette (in " eingeschlossen):

https://unicyclist.com/search?q=%22New%20Lowe%E2%80%99s%20commercial%20with%20UniGeezer%22

im Vergleich zu

https://unicyclist.com/search?q=%22New%20Lowe%27s%20commercial%20with%20UniGeezer%22

1 „Gefällt mir“

Danke für den Reproduktionsbericht. Dies betrifft im Wesentlichen die Suche nach exakten Begriffen, wenn die Suchbegriffe in " eingeschlossen sind. Das Problem besteht darin, dass der tatsächliche Titel des Themas New Lowe's commercial with UniGeezer lautet, während der fancy-Titel New Lowe’s commercial with UniGeezer ist. Bei der Suche nach exakten Begriffen vergleichen wir die angegebenen Begriffe nur mit dem Titel des Themas und nicht mit dem fancy-Titel.

Die Schwierigkeit besteht darin, dass wir nicht einfach bedingungslos durch ' ersetzen können, da ein Thema mit im Titel dann nicht mehr übereinstimmen würde. Ich bin mir ziemlich unsicher, was wir hier tun können, da wir auf der Client-Seite beim Anzeigen des Thementitels unterschiedliche Zeichen verwenden.

@gerhard @sam Ihr habt dieses Problem im Zusammenhang mit Anführungszeichen bereits angepackt. Habt ihr Ideen, was wir hier tun können? Um ehrlich zu sein, ist dies jedoch ein Randfall, der nur einen sehr kleinen Teil der Suchanfragen betrifft. Ich tendiere dazu, das einfach zu ignorieren.

1 „Gefällt mir“

Das ist keine Angelegenheit zum Lachen! :stuck_out_tongue_winking_eye:

Ich schätze, wir könnten im Index und im Suchbegriff zu ' normalisieren. Aber ehrlich gesagt bin ich mir nicht sicher, ob sich der riesige Aufwand lohnt, das zu beheben.

1 „Gefällt mir“

Dies hat nichts mit dem Suchindex zu tun. Für exakte Übereinstimmungen vergleichen wir es mit Post#raw und Topic#title:

1 „Gefällt mir“

Ich verstehe, ja … es gibt hier überhaupt keine einfache Lösung. Ich denke, das ist einfach ein Ärgernis, mit dem wir leben müssen.

2 „Gefällt mir“