Welcher Wort-Tokenizer wird in Discourse für verschiedene Sprachen verwendet?

xiasummer · 27. Mai 2020 um 00:53

Hallo, ich habe Discourse auf Chinesisch verwendet und festgestellt, dass viele Wörter nicht gut tokenisiert werden.

In einem Satz gibt es viele Wörter, die wir gut trennen müssen, um die Stichwortsuche und andere wichtige Funktionen zu unterstützen.

Ich muss jedoch sagen, dass ich der Meinung bin, dass der chinesische Tokenizer von Discourse nicht gut genug funktioniert.

Ist das ein „alter

sam · 27. Mai 2020 um 01:07

@fantasticfears hat das Gem entwickelt, das Ruby die Unterstützung dafür ermöglicht.

Gibt es spezifische Probleme, die Sie angesprochen sehen möchten?

Thema		Antworten	Aufrufe
Chinese search doesn't work to some words Support	15	1750	31. Oktober 2021
Korean words can't be searched Support	36	1699	22. November 2020
Search a term in Japanese Support	26	2283	2. Februar 2022
Searching Chinese terms in middle of sentence Feature	24	3548	4. Dezember 2025
Thai language support for searching Bug	4	1220	11. August 2020