Проблемы поиска в v2.3

Hello,

I’ve upgraded our Discourse instance from 2.2.6 to 2.3. Unfortunately we’ve noticed some issues with search:

  • the result contains mostly totally unrelated posts (many posts don’t have the search phrase)
  • the search ignores the options (like Matching in title only)

It shows up with terms containing accent like Hungarian word “tészta” :slight_smile: Ignore accents when searching for text. in admin settings is unchecked.

If you ever amend the site setting search ignore accents you must rebuild the full search index with:

./launcher enter app
rake search:reindex

Thanks for the hint! Unfortunately it doesn’t solve the problem :frowning:

It’s quite weird that some pre-2.3 posts contain search URLs (some has multi-word search terms with different accents) which are working fine and return valid result while new search queries are not working and give back not relevant posts.

Никто не сталкивался с этой проблемой? :fearful:

К сожалению, игнорировать диакритические знаки нельзя, так как это приведёт к неточным результатам. Куда мне стоит посмотреть, чтобы решить эту проблему? Может быть, откатиться до версии 2.2 (хотя это будет лишь временное решение :frowning: )?

Любые идеи будут приветствоваться!

Я всё ещё не понимаю проблему.

Опубликуйте здесь точный фрагмент текста с ожидаемым поведением. Тогда мы сможем протестировать это локально.

Поисковый запрос: “kávé in:title” (не работает даже без in:title)

Фрагмент результатов:

  • Szezámos káposzta
  • Káposztás lepény
  • A káromkodásról és csúnya beszédről
  • Diós, csokis masala kávé
  • Káposztás pizza
  • Kávékoncentrátum házilag

Правильный результат должен быть следующим:

  • Diós, csokis masala kávé
  • Diós, tejes kávé
  • Kávékoncentrátum házilag

Помимо нерелевантных результатов, некоторые подходящие вообще не отображаются.

Спасибо большое!

И вы на 100% подтверждаете, что в настройках сайта опция «Игнорировать диакритические знаки при поиске» снята и что вы выполнили повторную индексацию после её отключения?

Я выполнил переиндексацию после вашего сообщения в посте, и она завершилась без ошибок.

Есть ли какие-то новости по этой проблеме?

Я только что протестировал на try.discourse.org и создал 5 тем с указанными вами заголовками.

Затем я выполнил поиск по запросу “kávé in:title” и получил следующие результаты:

Мне это кажется правильным :man_shrugging:

Можете показать нам список всех настроек сайта, которые вы изменили?
(:warning: но обязательно удалите все конфиденциальные значения)

Спасибо за то, что разбираетесь в этой проблеме :+1:

Брендинг был упущен, здесь только изображения.

Только что проверил локально с настроенным по умолчанию языком «`magyar``, и всё работает.

Убедитесь, пожалуйста, что вы обновились до последней версии, и попробуйте снова.

Да, но, к сожалению, это не помогло :frowning:

Я выполнил чистую локальную установку, и слово «kávé» работало нормально, но некоторые другие слова — нет. Похоже, проблема связана с полнотекстовым поиском в PostgreSQL и тем, как анализируется текст. Например, поисковое слово «kávé» после нормализации превращается в «ká», и эта нормализованная форма сопоставляется с текстом, поэтому и «vé», и «poszta» считаются верными результатами полнотекстового поиска :slight_smile:

Надеюсь, ситуация улучшится при использовании словарей Hunspell в PostgreSQL, но на данный момент венгерский словарь не работает :sob: