مشاكل في قيمة الإرجاع لكاشف اللغة

لقد واجهنا مشكلتين مختلفتين في منتدين مختلفين، حيث بدأ توطين المحتوى في ترجمة المشاركات إلى لغتها الأصلية.

بالتعمق في هذا، اتضح أن كاشف اللغة لم يكن يتلقى رمز لغة نقيًا من النموذج اللغوي الكبير.

بدلاً من ذلك، كان ملفوفًا في markdown ``` (نسخ الأجزاء ذات الصلة من السجل فقط لسهولة القراءة

"delta":{"content":"```"}
"delta":{"content":"en```"},

أو كان لديه علامات اقتباس محيطة، ربما تم الخلط بينها وبين المطالبة التي تقول Output: \"en\"

"delta":{"content":"\""}
"delta":{"content":"en\""}

تغيير السطر الأخير من المطالبة إلى يجب أن يكون ردك رمز لغة، ولا شيء آخر. لا تقم بلف ردك في markdown. ساعد، لكنني أعتقد أن LanguageDetector.detect يجب أن ينظف الإجابة قليلاً (ربما يسمح فقط بـ AZaz و -؟) قبل استخدامه.

4 إعجابات

شكرا للإبلاغ، @nat سألقي نظرة

إعجابَين (2)

@RGJ لدينا طلب سحب مفتوح لهذا، ولكن هل يمكنك مشاركة نموذج اللغة الكبير الذي تستخدمه؟

إعجاب واحد (1)

لقد قمنا بإيقاف تشغيل هذا المثيل، ولكن على حد علمي كان Ministral 3B.

لقد قمت بدمج إصلاح هنا تضمن تحديث الموجه ونقل الأمثلة بعيدًا عن الموجه النظامي وإلى تفاعل مناسب.

يعمل فريقنا حاليًا على تقييمات لتحسين الموثوقية عبر نماذج لغوية كبيرة متنوعة.

إعجابَين (2)

تم إغلاق هذا الموضوع تلقائيًا بعد يومين. لم يعد يُسمح بالردود الجديدة.