Какой токенизатор слов для разных языков используется в Discourse?

xiasummer · 27.Май.2020 00:53:42

Привет! Я использовал Discourse на китайском языке и обнаружил, что многие слова не токенизируются корректно.

В предложении много слов, и их необходимо правильно разделять для поддержки поиска по ключевым словам и других важных функций.

Хотя я должен сказать, что, по моему мнению, токенизатор китайского языка в Discourse работает недостаточно хорошо.

Это «старый» токенизатор? Можно ли заменить его на новые?

Если вы читаете по-китайски, вот мои выводы:

sam · 27.Май.2020 01:07:50

@fantasticfears создал gem, который позволяет Ruby поддерживать эту библиотеку.

Заметили ли вы какие-либо конкретные проблемы, которые необходимо решить?

Тема		Ответов	Просм.
Chinese search doesn't work to some words Support	14	1771	14.12.2018
Korean words can't be searched Support	34	1766	27.05.2018
Search a term in Japanese Support	26	2333	02.02.2022
Searching Chinese terms in middle of sentence Feature	23	3595	08.10.2016
Thai language support for searching Bug	4	1233	11.08.2020