Problemas de pesquisa na v2.3

Hello,

I’ve upgraded our Discourse instance from 2.2.6 to 2.3. Unfortunately we’ve noticed some issues with search:

  • the result contains mostly totally unrelated posts (many posts don’t have the search phrase)
  • the search ignores the options (like Matching in title only)

It shows up with terms containing accent like Hungarian word “tészta” :slight_smile: Ignore accents when searching for text. in admin settings is unchecked.

If you ever amend the site setting search ignore accents you must rebuild the full search index with:

./launcher enter app
rake search:reindex

Thanks for the hint! Unfortunately it doesn’t solve the problem :frowning:

It’s quite weird that some pre-2.3 posts contain search URLs (some has multi-word search terms with different accents) which are working fine and return valid result while new search queries are not working and give back not relevant posts.

Ninguém encontrou esse problema? :fearful:

Infelizmente, os acentos não podem ser ignorados, pois isso resultaria em resultados imprecisos. Onde devo procurar para corrigir esse problema? Talvez fazer o downgrade para a versão 2.2 (seria apenas uma solução temporária, embora :frowning: )?

Qualquer ideia é bem-vinda!

Ainda não entendi o problema.

Cole um trecho exato do texto aqui com o comportamento que você esperaria. Assim, podemos testar isso localmente.

Termo de busca: “kávé in:title” (não funciona sem o in:title também)

Um trecho dos resultados:

  • Szezámos káposzta
  • Káposztás lepény
  • A káromkodásról és csúnya beszédről
  • Diós, csokis masala kávé
  • Káposztás pizza
  • Kávékoncentrátum házilag

O resultado correto deveria ser:

  • Diós, csokis masala kávé
  • Diós, tejes kávé
  • Kávékoncentrátum házilag

Além dos resultados irrelevantes, alguns válidos nem aparecem listados.

Muito obrigado!

E você confirma 100% que a opção ‘Ignorar acentos na pesquisa’ nas configurações do site está desmarcada e que você reindexou após desmarcá-la?

Fiz a reindexação após sua menção no post e ela foi concluída sem problemas.

Alguma atualização sobre este problema?

Acabei de testar em try.discourse.org e criei 5 tópicos com os títulos que você forneceu.

Em seguida, pesquisei por “kávé in:title” e obtive estes resultados

O que parece correto para mim :man_shrugging:

Você pode nos mostrar a lista de todas as configurações do site que você alterou?
(:warning: certifique-se de remover todos os valores sensíveis, porém)

Obrigado por investigar este problema :+1:

A marca não foi incluída; há apenas imagens.

Acabei de testar localmente com o locale padrão definido como “magyar” e também funciona.

Pode garantir que você atualizou para a versão mais recente e verificar novamente?

Sim, mas infelizmente não ajudou :frowning:

Fiz uma instalação local limpa e “kávé” funcionou bem, mas algumas outras palavras não. Parece que o problema está relacionado à pesquisa de texto completo no PostgreSQL e à forma como o texto é analisado. Por exemplo, a partir da palavra de busca “kávé”, o resultado será “ká” após a normalização, e essa forma normalizada será comparada ao texto, então “vé” e “poszta” são ambos resultados corretos para a pesquisa de texto completo :slight_smile:

Espero que a situação melhore com o uso de dicionários hunspell no PostgreSQL, mas atualmente o húngaro está quebrado :sob: