Qual è il tokenizzatore di parole per le diverse lingue in Discourse?

xiasummer · 27 Maggio 2020, 12:53am

Ciao, stavo usando Discourse in cinese e ho notato che molte parole non vengono tokenizzate correttamente.

In una frase ci sono molte parole e dobbiamo separarle bene per supportare la ricerca per parole chiave e altre funzioni importanti.

Detto questo, credo che il tokenizzatore cinese di Discourse non sia abbastanza efficace.

È un tokenizzatore “vecchio”? Possiamo sostituirlo con nuovi?

Se puoi leggere il cinese, ecco le mie osservazioni:

sam · 27 Maggio 2020, 1:07am

@fantasticfears ha creato il gem che consente a Ruby di supportarlo.

Hai notato problemi specifici che vorresti venissero risolti?

Argomento		Risposte	Visualizzazioni
Chinese search doesn't work to some words Support	15	1750	Ottobre 31, 2021
Korean words can't be searched Support	36	1699	Novembre 22, 2020
Search a term in Japanese Support	26	2283	Febbraio 2, 2022
Searching Chinese terms in middle of sentence Feature	24	3548	Dicembre 4, 2025
Thai language support for searching Bug	4	1220	Agosto 11, 2020