Add search synonyms

Dans Discourse-AI, nous avons commencé à expérimenter la recherche sémantique. Nous en sommes encore aux débuts et explorons ces systèmes.

L’utilisation des LLM pour améliorer les invites de recherche est également une approche possible (bien que lente aujourd’hui) :

Cette technique est mentionnée ici : GitHub - texttron/hyde: HyDE: Precise Zero-Shot Dense Retrieval without Relevance Labels


Outre les approches 100 % automatisées

Notre stratégie générale ici est d’itérer. Nous avons déjà des « mots surveillés » dans le produit, une fonctionnalité qui ajouterait des « synonymes de recherche » où vous spécifiez les fautes de frappe courantes et les phrases courantes que vous souhaitez « bourrer » ne me déplairait pas. Ce n’est pas un travail prévu, mais c’est certainement quelque chose que vous pourriez envisager de sponsoriser.

Il existe un précédent pour cette fonctionnalité exacte dans Postgres, conformément à : https://www.postgresql.org/docs/current/textsearch-dictionaries.html#TEXTSEARCH-SYNONYM-DICTIONARY

L’autre domaine que je suis prêt à explorer (bien que je n’y sois que tièdement favorable) est de permettre un espace « métadonnées » caché sur les publications, où les administrateurs peuvent ajouter des termes de recherche. C’est très, très invisible et en général, je recommande de « correctement » bourrer les œuvres afin que les choses ne soient pas cachées, par exemple :

SEO

sémantique, connexe, amélioration

2 « J'aime »