検索結果における部分一致の理解

ベニア検索について
「Pen」を検索すると、ペンシルベニア州の結果が表示されます。
「Penn」や「Pennsyl」でも同様です。
しかし、「Pennsy」を検索すると「結果が見つかりません」と表示される一方、他の検索語は期待通りに動作します。

Firefoxでは、この例では誤った検索文字列「Pennsy」は「ペンシルベニア州のメンバー」グループに対して1件の結果のみを返しますが、挙動は同様に奇妙です。

コンソールにエラーはなく、XHRヘッダーにも明らかな問題はありません。ただ、期待される挙動に合致する極めて小さなレスポンスオブジェクトが返ってくるだけです。

これがバージョンや実装の問題ではないかを確認するため、metaDotDiscourseでもテストしましたが、ここでも同様の現象が発生しました!

注:「Jus」でも同様のことが起こります(多数の結果が返る)。
「Just」ではユーザー結果のみが表示されます。
「justi」ではフォーラム結果が表示されます。
2つの例から、他の検索結果でも同様のことが起きていると推測されます。
興味深いことに、これは検索語の長さと関連しているようには見えません。いったい何が起きているのか、私には全くわかりません!

これはワードステミング、つまり技術的な検索概念に関連しています。

「いいね!」 1

ご配慮ありがとうございます。しかし、これは依然として以下の点で問題です。

  1. 予期せぬ動作です。同じ語根に対して、コンテンツが存在するにもかかわらず、結果が著しく異なる(あるいは結果が全くない)ケースが生じています。
  2. ブラウザ間の不整合も非常に奇妙ではありませんか?

当社のエンドユーザーは、ご指摘の通り技術的な研究用語である「ステミング」が何であるかを知りません。

投稿タイトルを変更してしまうと、同様の問題に直面している Discourse 導入事例の他のユーザーがフォーラム検索でこのトピックを見つけられなくなります。また、これがもはやバグ報告ではなくなるため、改善の可能性がある問題として認識され、対応を促す機会を失うことになります。

検索で必ず見つけたい重要な項目の場合は、タグ、特殊な単語、または他の明確なマーカーを使用してください。検索ストップワードについても興味があるかもしれません: