Discourseの検索はタイプミスに強いですか、また複数の単語ではどのように機能しますか?

例えば、DC検索エンジンは以下のクエリで「John Max Dolittle」を見つけられるでしょうか?

  • hohn <== タイプミス
  • john dolittle <== 文字列が抜けている
  • john mx doelitle <== ファジー

この投稿で知りました:Discourse search is awfully unsmart!
しかし、これはかなり古い(2017年)ものです。それ以降、改善されたのでしょうか?

Algoliaプラグインは公式ではなくなったようですね?

「いいね!」 1

AIベースの検索はタイポに強いですが、高速ではありません。

ただし、使用されている手法は、類似性を検索する前にLLMを使用して用語を展開する必要があるため、少し遅くなります。

一般的な検索はスノーボールを使用してステミングします: Snowball Stemmer - NLP - GeeksforGeeks

これは副作用としていくつかのタイポをキャッチしますが、実際にはこれは副作用的なものであり、メタフォンやその他の洗練されたタイポ削除技術を使用しているわけではなく、Postgresには単純なものは組み込まれていません。

Algoliaプラグインは引き続きサポートされ、公式です: Discourse Algolia Search

「いいね!」 5

参考までに、Algolia検索プラグインはまだ公式です :+1:

(当社でホストされている場合、Enterpriseプランで利用可能です)

「いいね!」 2