Olá
Estou gerenciando um fórum Discourse com conteúdo em persa e árabe. Encontrei um problema de pesquisa com títulos de tópicos contendo o artigo definido árabe “ال” (al-).
Problema
Tenho dois tópicos:
- الحسین بن زید (com “ال”)
- حسین بن زید (sem “ال”)
Ao pesquisar por um título, o outro não é incluído nos resultados.
Comportamento Desejado
Espero que a pesquisa por “حسین بن زید” ou “الحسین بن زید” retorne ambos os tópicos. A presença ou ausência de “ال” deve ser tratada automaticamente pela pesquisa, de forma semelhante a como variações são frequentemente tratadas em pesquisas em inglês. Os usuários não devem precisar usar caracteres curinga manualmente (como ? ou *) para encontrar ambas as variações.
Comportamento Atual
A pesquisa é muito específica, correspondendo apenas ao título exato inserido. Isso significa que o algoritmo de pesquisa não normaliza ou ignora o “ال” para melhor descoberta.
Pergunta
Existe alguma configuração, plugin ou melhoria de indexação no Discourse para habilitar essa normalização automática para títulos em árabe/persa? Como posso fazer com que a pesquisa trate títulos com e sem “ال” como variações do mesmo termo sem exigir entrada manual de curingas dos usuários?
Qualquer orientação é apreciada.
Obrigado.