Bonjour, j’utilisais Discourse en chinois et j’ai constaté que de nombreux mots n’étaient pas bien segmentés.
Dans une phrase, nous avons de nombreux mots, et il est nécessaire de les séparer correctement pour prendre en charge la recherche par mot-clé et d’autres fonctions importantes.
Je dois dire que je pense que le segmenteur de mots chinois de Discourse n’est pas assez performant.
S’agit-il d’un segmenteur « ancien » ? Peut-on le remplacer par de nouveaux ?
Si vous pouvez lire le chinois, voici mes constats :