¿Cuál es el tokenizador de palabras para diferentes idiomas en Discourse?

xiasummer · 27 Mayo, 2020 00:53

Hola, estaba usando Discourse en chino. Y noté que muchas palabras no se tokenizan correctamente.

En una oración hay muchas palabras y necesitamos separarlas bien para apoyar la búsqueda por palabras clave y otras funciones importantes.

Aunque debo decir que creo que el tokenizador de palabras chinas de Discourse no funciona lo suficientemente bien.

¿Es un tokenizador “antiguo”? ¿Podemos reemplazarlo con otros más nuevos?

Si puedes leer chino, aquí están mis hallazgos:

sam · 27 Mayo, 2020 01:07

@fantasticfears construyó la gema que permite a Ruby tener soporte para esto.

¿Estás notando algún problema específico que te gustaría que abordemos?

Tema		Respuestas	Vistas
Chinese search doesn't work to some words Support	15	1750	31 Octubre 2021
Korean words can't be searched Support	36	1699	22 Noviembre 2020
Search a term in Japanese Support	26	2283	2 Febrero 2022
Searching Chinese terms in middle of sentence Feature	24	3548	4 Diciembre 2025
Thai language support for searching Bug	4	1220	11 Agosto 2020