Bonjour
Je gère un forum Discourse avec du contenu en persan et en arabe. J’ai rencontré un problème de recherche avec des titres de sujets contenant l’article défini arabe « ال » (al-).
Problème
J’ai deux sujets :
- الحسین بن زید (avec « ال »)
- حسین بن زید (sans « ال »)
Lorsque je recherche un titre, l’autre n’est pas inclus dans les résultats.
Comportement souhaité
Je m’attends à ce que la recherche de « حسین بن زید » ou de « الحسین بن زید » renvoie les deux sujets. La présence ou l’absence de « ال » devrait être gérée automatiquement par la recherche, de la même manière que les variations sont souvent traitées dans la recherche en anglais. Les utilisateurs ne devraient pas avoir à utiliser manuellement des caractères génériques (comme ? ou *) pour trouver les deux variations.
Comportement actuel
La recherche est trop spécifique, ne correspondant qu’au titre exact saisi. Cela signifie que l’algorithme de recherche ne normalise ni n’ignore le « ال » pour une meilleure découvrabilité.
Question
Existe-t-il un paramètre, un plugin ou une amélioration de l’indexation dans Discourse pour permettre cette normalisation automatique des titres arabes/persans ? Comment puis-je faire en sorte que la recherche traite les titres avec et sans « ال » comme des variations du même terme sans nécessiter d’entrée manuelle avec des caractères génériques de la part des utilisateurs ?
Toute aide est appréciée.
Merci.