نتائج البحث غير مميزة في بعض اللغات

مرحبًا! في تثبيت Discourse 2.5.0.beta1 الخاص بي، لا تعمل ميزة تمييز الكلمات المفتاحية المُدخلة في نتائج البحث عند إجراء البحث بلغات غير الإنجليزية.
هل هذه عيب أم ميزة؟
شكرًا لك

ما هو المتوقع هنا @sam؟

نسلّط الضوء فقط على الكلمات الكاملة. يبدو هذا وكأنه كلمة جزئية.

مرحبًا! نتوقع أن يتم تمييز الكلمة المفتاحية المكتشفة على النحو التالي:

عذرًا، ليس في هذه الحالة:

@vinothkannans هل يمكنك إلقاء نظرة سريعة على:

@smith هل يمكنك نشر منشور هنا بالكلمة اليونانية بالضبط؟ (أعتقد أنها يونانية) قد يكون هذا خطأ في مكتبة الجافا سكريبت الخاصة بالتمييز اللوني لدينا.

هذا هو السيريالي، المستند إلى اليونانية، وإليك مثالًا:

لأنه قد بدا للروح القدس ولنا أن لا نحمل عليكم ثقلًا آخر غير هذا الضروري:
أن تمتنعوا عن ذبائح الأصنام والدم والمخنوق والزنا، ولا تفعلوا بالآخرين ما لا تريدون أن يفعل بكم. فبمراعتكم هذا تفعلون خيرًا. كونوا أصحاء.

المشكلة تكمن في مكون jQuery Highlight. ولتسليط الضوء على الكلمات، يستخدم المكون تعبيرًا نمطيًا يعتمد على حدود الكلمات \b، وهو غير مدعوم مع الأحرف Unicode.

https://medium.com/@shiba1014/regex-word-boundaries-with-unicode-207794f6e7ed

(?<=[\s,.:;"']|^)UNICODE_WORD(?=[\s,.:;"']|$)

يبدو أن هذا حل محتمل :thinking:

أعتقد أن @gerhard قد تعامل مع هذه المشكلة تحديدًا فيما يتعلق بأسماء المستخدمين المكونة من رموز يونيكود (على الأقل أتذكر ذلك بشكل ضبابي).

سعيد جدًا برؤية إصلاح هنا، لكن يجب أن نكون حذرين للغاية لضمان أن أي تعبير نمطي نختاره لا يعاني من أداء ضعيف بشكل مرضي في حالات معينة حيث يكون النص طويلاً أو سيئًا بشكل خاص. كما أعتقد أننا في اللغة الصينية لا نهتم حتى بحدود الكلمات؟

تم إنشاء طلب سحب جديد مع الإصلاح