Problemas de búsqueda en v2.3

Hello,

I’ve upgraded our Discourse instance from 2.2.6 to 2.3. Unfortunately we’ve noticed some issues with search:

  • the result contains mostly totally unrelated posts (many posts don’t have the search phrase)
  • the search ignores the options (like Matching in title only)

It shows up with terms containing accent like Hungarian word “tészta” :slight_smile: Ignore accents when searching for text. in admin settings is unchecked.

If you ever amend the site setting search ignore accents you must rebuild the full search index with:

./launcher enter app
rake search:reindex

Thanks for the hint! Unfortunately it doesn’t solve the problem :frowning:

It’s quite weird that some pre-2.3 posts contain search URLs (some has multi-word search terms with different accents) which are working fine and return valid result while new search queries are not working and give back not relevant posts.

¿Nadie ha encontrado este problema? :fearful:

Lamentablemente, los acentos no se pueden ignorar porque daría lugar a resultados inexactos. ¿Dónde debería buscar para solucionar este problema? ¿Quizás volver a la versión 2.2 (aunque sería solo una solución temporal :frowning: )?

¡Cualquier idea es bienvenida!

Aún no entiendo el problema.

Publica aquí un fragmento exacto del texto con el comportamiento que esperas. Así podremos probarlo localmente.

Término de búsqueda: “kávé in:title” (tampoco funciona sin in:title)

Un fragmento de los resultados:

  • Szezámos káposzta
  • Káposztás lepény
  • A káromkodásról és csúnya beszédről
  • Diós, csokis masala kávé
  • Káposztás pizza
  • Kávékoncentrátum házilag

El resultado correcto debería ser:

  • Diós, csokis masala kávé
  • Diós, tejes kávé
  • Kávékoncentrátum házilag

Además de los resultados irrelevantes, algunos válidos no aparecen en absoluto.

¡Muchas gracias!

¿Y confirmas al 100 % que la opción “ignorar acentos en búsquedas” en la configuración del sitio está desmarcada y que realizaste una reindexación después de desmarcarla?

He realizado la reindexación después de lo que mencionaste en tu publicación y se completó sin ningún problema.

¿Hay alguna actualización sobre este problema?

Acabo de probar en try.discourse.org y creé 5 temas con los títulos que proporcionaste.

Luego, busqué “kávé in:title” y obtuve estos resultados

Lo cual me parece correcto :man_shrugging:

¿Podrías mostrarnos la lista de todas las configuraciones del sitio que has modificado?
(:warning: asegúrate de eliminar todos los valores sensibles)

Gracias por investigar este problema :+1:

La marca no se incluyó; solo hay imágenes.

Acabo de probarlo localmente con la configuración regional predeterminada en “magyar” y también funciona.

¿Puedes asegurarte de actualizar a la última versión y volver a comprobarlo?

Sí, pero desafortunadamente no ayudó :frowning:

He realizado una instalación local fresca y “kávé” funcionó bien, pero algunas otras palabras no. Parece que el problema está relacionado con la búsqueda de texto completo en PostgreSQL y cómo se analiza el texto. Por ejemplo, la palabra de búsqueda “kávé” se convierte en “ká” después de la normalización, y esa forma normalizada se compara con el texto, por lo que “vé” y “poszta” son ambos resultados correctos para la BTF :slight_smile:

Espero que la situación mejore al usar diccionarios hunspell en PostgreSQL, pero actualmente el húngaro está roto :sob: