Algumas palavras em francês usam os seguintes caracteres:
Œ, œ, como em œuf (ovo) ou cœur (coração), œuvre (várias traduções e significados, então não detalharei aqui, não importa), etc.
Æ, æ, como em nævus (o termo científico para pinta (a marca na pele, não o animal) ou outros.
æ é raramente usado (acho que são sempre termos científicos/médicos do latim?), mas œ, no entanto, está bastante presente na língua francesa.
Infelizmente, esses caracteres especiais não estão presentes no layout do teclado francês e muitas pessoas simplesmente escrevem “oe” ou “ae” em vez disso.
Mas alguns usuários têm layouts personalizados, e a autocorreção de smartphones, ou alguns outros sistemas de ajuda de escrita, frequentemente corrigem automaticamente as palavras usando os “caracteres mesclados” adequados, como “oeuvre” → “œuvre”.
Atualmente, a busca processa “oe” e “œ” como strings diferentes, o que leva a resultados diferentes que deveriam ser comuns.
Você acha que devemos simplesmente alterar a implementação de search_ignore_accents para usar unaccent ou precisaríamos de uma configuração totalmente nova?
Eu gosto de simplesmente alterar a implementação de ignorar acentos, pois há paridade com o que o PG faz de qualquer maneira.
Essa é uma boa pergunta
Definitivamente funcionaria para , mas pode haver outras localidades onde não funcionaria como esperado?
Depois de olhar os arquivos /usr/share/postgresql/13/tsearch_data/unaccent.rules, parece que é bem seguro.
Eu definitivamente apoio a remoção da alteração da nossa configuração search_ignore_accents para usar o unaccent do postgresql @nbianca você pode adicionar isso à sua lista?