Questão de pesquisa: Títulos com/sem o artigo definido árabe "ال" não são tratados como variações

Olá

Estou gerenciando um fórum Discourse com conteúdo em persa e árabe. Encontrei um problema de pesquisa com títulos de tópicos contendo o artigo definido árabe “ال” (al-).

Problema

Tenho dois tópicos:

  • الحسین بن زید (com “ال”)
  • حسین بن زید (sem “ال”)

Ao pesquisar por um título, o outro não é incluído nos resultados.

Comportamento Desejado

Espero que a pesquisa por “حسین بن زید” ou “الحسین بن زید” retorne ambos os tópicos. A presença ou ausência de “ال” deve ser tratada automaticamente pela pesquisa, de forma semelhante a como variações são frequentemente tratadas em pesquisas em inglês. Os usuários não devem precisar usar caracteres curinga manualmente (como ? ou *) para encontrar ambas as variações.

Comportamento Atual

A pesquisa é muito específica, correspondendo apenas ao título exato inserido. Isso significa que o algoritmo de pesquisa não normaliza ou ignora o “ال” para melhor descoberta.

Pergunta

Existe alguma configuração, plugin ou melhoria de indexação no Discourse para habilitar essa normalização automática para títulos em árabe/persa? Como posso fazer com que a pesquisa trate títulos com e sem “ال” como variações do mesmo termo sem exigir entrada manual de curingas dos usuários?

Qualquer orientação é apreciada.

Obrigado.

4 curtidas