搜索问题:包含或不包含阿拉伯定冠词“ال”的标题未被视为不同变体

您好

我正在管理一个 Discourse 论坛,其中包含波斯语和阿拉伯语内容。我遇到了一个搜索问题,主题标题中包含阿拉伯语的定冠词“ال”(al-)

问题

我有两个主题:

  • الحسین بن زید(包含“ال”)
  • حسین بن زید(不包含“ال”)

搜索其中一个标题时,另一个标题不会包含在结果中。

期望行为

我期望搜索“حسین بن زید”或“الحسین بن زید”时能返回两个主题。搜索应自动处理“ال”的存在或缺失,就像英语搜索中经常处理变体一样。**用户无需手动使用通配符(如 ?* )**来查找两种变体。

当前行为

搜索过于精确,仅匹配输入的精确标题。这意味着搜索算法不会标准化或忽略“ال”以提高可发现性。

问题

Discourse 中是否有设置插件索引改进来启用阿拉伯语/波斯语标题的自动标准化?如何在不要求用户手动输入通配符的情况下,让搜索将包含和不包含“ال”的标题视为同一术语的变体?

任何指导都将不胜感激。

谢谢。

4 个赞