Normalização de Pesquisa em Árabe: Falta Suporte para Variantes de Hamza, Formas de Ya/Kaf e Equivalência Ortográfica

Para esta parte do problema, estamos falando de uma normalização do padrão Unicode NFKC (para citar um)?

(Eu nem tenho certeza do que fazemos… presumo que normalizamos o texto das postagens no pipeline de processamento?)

1 curtida