Problème de recherche : Les titres avec/sans l'article défini arabe "ال" ne sont pas traités comme des variations

Bonjour

Je gère un forum Discourse avec du contenu en persan et en arabe. J’ai rencontré un problème de recherche avec des titres de sujets contenant l’article défini arabe « ال » (al-).

Problème

J’ai deux sujets :

  • الحسین بن زید (avec « ال »)
  • حسین بن زید (sans « ال »)

Lorsque je recherche un titre, l’autre n’est pas inclus dans les résultats.

Comportement souhaité

Je m’attends à ce que la recherche de « حسین بن زید » ou de « الحسین بن زید » renvoie les deux sujets. La présence ou l’absence de « ال » devrait être gérée automatiquement par la recherche, de la même manière que les variations sont souvent traitées dans la recherche en anglais. Les utilisateurs ne devraient pas avoir à utiliser manuellement des caractères génériques (comme ? ou *) pour trouver les deux variations.

Comportement actuel

La recherche est trop spécifique, ne correspondant qu’au titre exact saisi. Cela signifie que l’algorithme de recherche ne normalise ni n’ignore le « ال » pour une meilleure découvrabilité.

Question

Existe-t-il un paramètre, un plugin ou une amélioration de l’indexation dans Discourse pour permettre cette normalisation automatique des titres arabes/persans ? Comment puis-je faire en sorte que la recherche traite les titres avec et sans « ال » comme des variations du même terme sans nécessiter d’entrée manuelle avec des caractères génériques de la part des utilisateurs ?

Toute aide est appréciée.

Merci.

4 « J'aime »