Лучший поиск или похожие темы

Я искал информацию об уведомлении о групповом задании. Сначала я поискал, а затем создал новую тему. Как только я ввёл заголовок темы — который совпадал с моим поисковым запросом — появился список связанных постов. Этот список отличался от результатов поиска и, на мой взгляд, был более релевантным.

Что-то здесь не так.

Вот скриншот с релевантными постами:

А вот воссозданный скриншот моего поиска:

1 лайк

Я немного покопался и, кажется, что поиск по фразе «Тема похожа на» ищет только первые сообщения в темах (возможно, придавая больший вес заголовкам тем?), тогда как обычный поиск сопоставляет любой пост в теме, что, возможно, объясняет разницу?

Это явление, которое люди также наблюдали на Stack Overflow. Возможно, иронично, но я использовал обычный поиск («почему дублирующиеся предложения лучше, чем поиск») и не нашёл этот вопрос на Meta Stack Overflow. Однако, поскольку я знал, что он существует, я переключился на создание вопроса с тем же запросом, что и в моём заголовке, и получил список дубликатов. Консенсус был таков: акцент на заголовках имеет решающее значение.

Я экспериментировал с поиском по заголовкам (in:title здесь и title: на Stack Overflow), но этого недостаточно. Заголовки просто слишком коротки. Если вы не угадаете точные слова, использованные в заголовке, совпадений не будет. Поэтому я подозреваю, что ответ таков, как предполагает @JammyDodger: заголовок + тело первого поста. (Или заголовок + тело вопроса на SO.) Это имеет смысл, потому что когда вы начинаете тему (или задаёте вопрос), вы с большей вероятностью используете фразы, характерные для людей, начинающих разговор, а не продолжающих его.

Возьмём этот пост. Я не использовал фразу «похожие темы» до самого момента, потому что контекст был задан первым постом темы. Я также включил слова, косвенно связанные с основной темой, например «Stack Overflow». По мере роста длины темы вероятность того, что в побочном разговоре будут встречаться искомые поисковые термины, также увеличивается. Возможно, именно этот отклоняющийся от темы пост, расположенный на 100-й позиции, является тем, что вы ищете. Однако, по моему мнению, вам лучше смотреть на результаты поиска только по первому посту в теме.

Вы можете симулировать поиск «похожих тем», используя опцию поиска in:first. Я не знаю, учитывает ли она заголовок так же, и могут быть и другие различия. (Я ещё не изучал код.) Тем не менее, результаты поиска по вашему запросу не кажутся лучше. Ощущается почти так же, как обычный поиск без этой опции. Возможно, имеет значение добавление веса к теме, и должна быть опция для симуляции поиска похожих тем?

Мне также интересно, даст ли поиск, включающий оригинальный пост темы, заголовок и любой пост, помеченный как решение, лучшие результаты.

Стоит отметить, что я нашёл эту тему через обычный поиск, но искал способ отключить подсказки «похожие темы». Я в основном использую Discourse как блог, и меня не смущает время от времени писать на похожие темы. Создание темы с моим вопросом привело меня к моему ответу.