A busca do Discourse é imune a erros de digitação e como ela funciona com várias palavras?

Por exemplo, o mecanismo de busca do DC encontrará “John Max Dolittle” com as seguintes consultas:

  • hohn <== erro de digitação
  • john dolittle <== string em falta
  • john mx doelitle <== fuzzy

Fui alertado por esta postagem: Discourse search is awfully unsmart!
Mas é bem antiga (2017). As coisas melhoraram desde então?

Parece que o plugin Algolia não é mais oficial?

1 curtida

A pesquisa baseada em IA é imune a erros de digitação, mas não é rápida:

No entanto, a técnica utilizada significa que é um pouco mais lenta, pois precisamos expandir o termo usando um LLM antes de procurar similaridade.

A pesquisa geral usa stemming com snowball: Snowball Stemmer - NLP - GeeksforGeeks

Ele captura alguns erros de digitação como um efeito colateral, mas realmente isso é uma coisa de efeito colateral, não estamos usando metaphone ou outras técnicas sofisticadas de apagamento de erros de digitação, não há nada simples embutido no postgres para isso.

O plugin Algolia continua suportado e oficial: Discourse Algolia Search

5 curtidas

Aliás, o plugin de busca Algolia ainda é #oficial :+1:

(Se você é hospedado por nós, ele está disponível nos planos Enterprise)

2 curtidas