RGJ
(Richard - Communiteq)
7 سبتمبر 2025، 8:49ص
1
لقد واجهنا مشكلتين مختلفتين في منتدين مختلفين، حيث بدأ توطين المحتوى في ترجمة المشاركات إلى لغتها الأصلية.
بالتعمق في هذا، اتضح أن كاشف اللغة لم يكن يتلقى رمز لغة نقيًا من النموذج اللغوي الكبير.
بدلاً من ذلك، كان ملفوفًا في markdown ``` (نسخ الأجزاء ذات الصلة من السجل فقط لسهولة القراءة
"delta":{"content":"```"}
"delta":{"content":"en```"},
أو كان لديه علامات اقتباس محيطة، ربما تم الخلط بينها وبين المطالبة التي تقول Output: \"en\"
"delta":{"content":"\""}
"delta":{"content":"en\""}
تغيير السطر الأخير من المطالبة إلى يجب أن يكون ردك رمز لغة، ولا شيء آخر. لا تقم بلف ردك في markdown. ساعد، لكنني أعتقد أن LanguageDetector.detect يجب أن ينظف الإجابة قليلاً (ربما يسمح فقط بـ AZaz و -؟) قبل استخدامه.
4 إعجابات
sam
(Sam Saffron)
15 سبتمبر 2025، 1:24ص
3
شكرا للإبلاغ، @nat سألقي نظرة
إعجابَين (2)
nat
(Natalie T)
4 نوفمبر 2025، 3:21ص
5
@RGJ لدينا طلب سحب مفتوح لهذا، ولكن هل يمكنك مشاركة نموذج اللغة الكبير الذي تستخدمه؟
إعجاب واحد (1)
RGJ
(Richard - Communiteq)
4 نوفمبر 2025، 6:14ص
7
لقد قمنا بإيقاف تشغيل هذا المثيل، ولكن على حد علمي كان Ministral 3B.
nat
(Natalie T)
5 نوفمبر 2025، 10:17ص
8
لقد قمت بدمج إصلاح هنا تضمن تحديث الموجه ونقل الأمثلة بعيدًا عن الموجه النظامي وإلى تفاعل مناسب.
main ← sanitise-locale-detection
opened 11:37AM - 03 Nov 25 UTC
This commit improves the prompt, and also matches the return value against this:…
- https://datatracker.ietf.org/doc/html/rfc5646#section-2.2.1
- **Primary Language Subtag**: ... Two-character primary language subtags were defined in the IANA registry according to the assignments found in the standard "ISO 639-1:2002 ...
- **Extended Language Subtags**: ... Extended language subtags consist solely of three-letter subtags.
Meta: https://meta.discourse.org/t/locale-detector-return-value-issues/381852
يعمل فريقنا حاليًا على تقييمات لتحسين الموثوقية عبر نماذج لغوية كبيرة متنوعة.
إعجابَين (2)
nat
(Natalie T)
تم إغلاقه في
8 نوفمبر 2025، 12:00ص
9
تم إغلاق هذا الموضوع تلقائيًا بعد يومين. لم يعد يُسمح بالردود الجديدة.