ما هو المميز للكلمات (word tokenizer) للغات المختلفة في discourse؟

xiasummer · 27 مايو 2020، 12:53ص

مرحباً، كنت أستخدم Discourse باللغة الصينية ووجدت أن العديد من الكلمات لا يتم تقسيمها بشكل جيد.

في جملة ما، لدينا العديد من الكلمات، ويحتاج الأمر إلى فصلها بشكل صحيح لدعم البحث بالكلمات المفتاحية والوظائف المهمة الأخرى.

مع ذلك، يجب أن أقول إنني أعتقد أن أداة تقسيم الكلمات الصينية في Discourse لا تعمل بشكل كافٍ.

هل هذه أداة تقسيم “قديمة”؟ هل يمكننا استبدالها بأدوات أحدث؟

إذا كنت تستطيع قراءة الكلمات الصينية، فإليك ملاحظاتي:

sam · 27 مايو 2020، 1:07ص

قام @fantasticfears ببناء الـ gem الذي يمكّن Ruby من دعم هذه الميزة.

هل لاحظت أي مشكلات محددة تود معالجتها؟

الموضوع		الردود	مرات العرض
Chinese search doesn't work to some words Support	15	1750	31 أكتوبر 2021
Korean words can't be searched Support	36	1699	22 نوفمبر 2020
Search a term in Japanese Support	26	2283	2 فبراير 2022
Searching Chinese terms in middle of sentence Feature	24	3548	4 ديسمبر 2025
Thai language support for searching Bug	4	1220	11 أغسطس 2020