La ricerca Discourse è immune agli errori di battitura e come funziona con più parole?

Ad esempio, il motore di ricerca DC troverà “John Max Dolittle” con le seguenti query:

  • hohn <== errore di battitura
  • john dolittle <== stringa mancante
  • john mx doelitle <== fuzzy

Sono stato avvisato da questo post: Discourse search is awfully unsmart!
Ma è piuttosto vecchio (2017). Le cose sono migliorate da allora?

Sembra che il plugin Algolia non sia più ufficiale?

1 Mi Piace

La ricerca basata sull’IA è immune agli errori di battitura, ma non è veloce:

Tuttavia, la tecnica utilizzata significa che è un po’ più lenta perché dobbiamo espandere il termine utilizzando un LLM prima di cercare la somiglianza.

La ricerca generale utilizza lo stemming con snowball: Snowball Stemmer - NLP - GeeksforGeeks

Cattura alcuni errori di battitura come effetto collaterale, ma in realtà si tratta di un effetto collaterale, non stiamo utilizzando metaphone o altre tecniche sofisticate di cancellazione degli errori di battitura, non c’è nulla di semplice integrato in postgres per questo.

Il plugin Algolia rimane supportato e ufficiale: Discourse Algolia Search

5 Mi Piace

FWIW il plug-in di ricerca Algolia è ancora #ufficiale :+1:

(Se sei ospitato da noi, è disponibile sui piani Enterprise)

2 Mi Piace