¿La búsqueda de Discourse es inmune a los errores tipográficos y cómo funciona con varias palabras?

Por ejemplo, ¿encontrará el motor de búsqueda de DC “John Max Dolittle” con las siguientes consultas?:

  • hohn <== error tipográfico
  • john dolittle <== cadena faltante
  • john mx doelitle <== difuso

Me alertó esta publicación: Discourse search is awfully unsmart!
Pero es bastante antigua (2017). ¿Han mejorado las cosas desde entonces?

¿Parece que el complemento Algolia ya no es oficial?

1 me gusta

La búsqueda basada en IA es inmune a los errores tipográficos, pero no es rápida:

Sin embargo, la técnica utilizada significa que es un poco más lenta porque necesitamos expandir el término usando un LLM antes de buscar similitudes.

La búsqueda general utiliza stemmers con snowball: Snowball Stemmer - NLP - GeeksforGeeks

Detecta algunos errores tipográficos como efecto secundario, pero realmente esto es un efecto secundario, no estamos utilizando metaphone u otras técnicas sofisticadas de borrado de errores tipográficos, no hay nada simple incorporado en postgres para eso.

El plugin de Algolia sigue siendo compatible y oficial: Discourse Algolia Search

5 Me gusta

FWIW, el plugin de búsqueda de Algolia sigue siendo official :+1:

(Si está alojado por nosotros, está disponible en los planes Enterprise)

2 Me gusta