La recherche Discourse est-elle immunisée contre les fautes de frappe et comment fonctionne-t-elle avec plusieurs mots ?

Par exemple, le moteur de recherche DC trouvera-t-il « John Max Dolittle » avec les requêtes suivantes :

  • hohn <== faute de frappe
  • john dolittle <== chaîne manquante
  • john mx doelitle <== flou

J’ai été alerté par ce post : Discourse search is awfully unsmart!
Mais il est assez ancien (2017). Les choses se sont-elles améliorées depuis ?

Il semble que le plugin Algolia ne soit plus officiel ?

1 « J'aime »

La recherche basée sur l’IA est immunisée contre les fautes de frappe, mais elle n’est pas rapide :

Cependant, la technique utilisée signifie qu’elle est un peu plus lente car nous devons développer le terme à l’aide d’un LLM avant de rechercher la similarité.

La recherche générale utilise le stemming avec snowball : Snowball Stemmer - NLP - GeeksforGeeks

Elle corrige certaines fautes de frappe comme effet secondaire, mais c’est vraiment un effet secondaire, nous n’utilisons pas metaphone ou d’autres techniques sophistiquées d’effacement des fautes de frappe, il n’y a rien de simple intégré dans postgres pour cela.

Le plugin Algolia reste pris en charge et officiel : Discourse Algolia Search

5 « J'aime »

Soit dit en passant, le plugin de recherche Algolia est toujours #officiel :+1:

(Si vous êtes hébergé par nous, il est disponible sur les plans Entreprise)

2 « J'aime »