La búsqueda debe coincidir con caracteres especiales con su equivalente "normal"

He copiado y pegado el título de un tema (tal como se muestra, con entidades especiales) en la búsqueda:
New Lowe’s commercial with UniGeezer

Sin resultados:

He reemplazado la comilla especial por la “normal” en el campo de búsqueda:
New Lowe's commercial with UniGeezer

Ahora aparece el tema.

Mi sugerencia es que la búsqueda debería igualar cada carácter especial con su equivalente original.

8 Me gusta

Buen punto, ¿cómo deberíamos manejar esto @sam?

3 Me gusta

¿Qué pasa con los acentos?

Ya tenemos cierta normalización para los acentos, así que quizás podamos corregir esto de manera similar.

@tgxworld puede pensarlo.

3 Me gusta

@Canapin ¿Sigues pudiendo reproducir esto? Intenté reproducirlo localmente pero no pude. El apóstrofo se elimina de los datos de búsqueda, por lo que no debería tener ningún efecto en la búsqueda.

discourse_development=# SELECT TO_TSVECTOR('english', 'New Lowe’s commercial with UniGeezer') @@ PLAINTO_TSQUERY('english', 'New Lowe’s commercial with UniGeezer');
 ?column? 
----------
 t
(1 row)

¿Podrías indicarme el sitio donde estás teniendo este problema para que pueda obtener una reproducción? ¡Gracias!

1 me gusta

Sigo teniendo el problema, y ocurre cuando busco la cadena exacta (envuelta en "):

https://unicyclist.com/search?q=%22New%20Lowe%E2%80%99s%20commercial%20with%20UniGeezer%22

frente a

https://unicyclist.com/search?q=%22New%20Lowe%27s%20commercial%20with%20UniGeezer%22

1 me gusta

Gracias por el reporte. Esto afecta básicamente a la búsqueda de términos exactos cuando los términos de búsqueda están entrecomillados con ". El problema aquí es que el título real del tema es en realidad New Lowe's commercial with UniGeezer, pero el título estilizado es New Lowe’s commercial with UniGeezer. Cuando realizamos una búsqueda de términos exactos, solo estamos comparando los términos dados con el título del tema y no con el título estilizado.

La dificultad aquí es que no podemos simplemente reemplazar con ' incondicionalmente, porque un título de tema que contenga dejaría de coincidir. Estoy bastante inseguro sobre qué podemos hacer en este caso, ya que estamos mostrando caracteres diferentes en el lado del cliente al mostrar el título del tema.

@gerhard @sam Parece que ya habéis abordado este problema relacionado con las comillas antes; ¿tenéis alguna idea de qué podemos hacer? Para ser honesto, sin embargo, se trata de un caso excepcional que afectará a una parte muy pequeña de las consultas de búsqueda. Me inclino simplemente a pasar de largo.

1 me gusta

¡Esto no es motivo de risa! :stuck_out_tongue_winking_eye:

Supongo que podríamos normalizar a ' en el índice y el término de búsqueda. Pero, siendo honesto, no estoy seguro de que valga la pena un esfuerzo enorme arreglar esto.

1 me gusta

Esto no está relacionado con el índice de búsqueda. Para coincidencias exactas, lo comparamos con Post#raw y Topic#title:

1 me gusta

Ya veo, sí… no hay ninguna solución fácil aquí en absoluto, creo que esto es solo un detalle con el que tenemos que vivir.

2 Me gusta