ماذا يحدث للترجمات عند تغيير نموذج اللغة الكبيرة؟

إذا قمت بتغيير نموذج اللغة الكبيرة (LLM)، فهل تُترجم جميع المنشورات من جديد؟

كنت أستخدم نموذجًا مستضافًا على منصة Groq، وكان قد أكمل حوالي 95٪ من الترجمة عندما بدأت في مواجهة أخطاء. بعد التحقيق، أدركت أن منصة Groq قد ألغت دعم النموذج الذي كنت أستخدمه. لذا قمت بإعداد نموذج جديد على Groq ثم قمت بتحديث معلمات النموذج في نظام Discourse.

ألاحظ أن نظام Discourse يستخدم الآن ملايين الرموز (tokens) يوميًا مع نموذج الترجمة المحدّث، لكن شريط التقدم في صفحة حالة الترجمات لا يتقدم على الإطلاق (لا يزال عالقًا عند 95٪).

لذلك أحاول فهم ما يحدث عند تغيير معلمات نموذج اللغة الكبيرة (LLM). هل يبدأ النظام عملية الترجمة من الصفر؟ وإذا كان الأمر كذلك، فهل توجد أي طريقة لمنع ذلك والعودة إلى حيث توقفنا؟

يعتمد الأمر، على سبيل المثال، إذا قمت بالترجمة باستخدام نموذج من Gemini ثم انتقلت إلى نموذج آخر، فستقوم بإنشاء ذاكرة تخزين مؤقت جديدة للكلمات. في تجربتي، فضلت الاحتفاظ بثلاثة مسارات، اثنان منهما يستخدمان نفس النموذج، وقمت الآن بتفعيل نموذج Gemini Flash Lite للمحتوى الجديد، وحتى الآن لم تواجه أي مشاكل.

يتم الاحتفاظ بالترجمات القديمة، وسينجز نموذج اللغة الكبير (LLM) الجديد فقط الترجمات لما لم يُترجم حتى الآن.

ما الذي يمكنني فعله للتحقق مما يحدث؟

كل يوم يستهلك نموذج اللغة الكبير ملايين الرموز للترجمة (حيث يصل إلى الحد اليومي لواجهة برمجة التطبيقات)، لكن لا توجد أي تقدم في إحصائيات الترجمة (0 ترجمة متزايدة). انظر لقطات الشاشة.


فعّل السجلات التفصيلية وتحقق من آخر إدخالات في جدول سجلات تدقيق واجهة برمجة التطبيقات الخاصة بالذكاء الاصطناعي.

حسنًا، لقد قمت بتفعيل تصحيح ترجمة الذكاء الاصطناعي من خلال وحدة تحكم Rails عبر الأمر SiteSettings.ai_translation_verbose_logs = true، وعلى مدار اليومين الماضيين أرى هذا في صفحة سجلات الأخطاء /logs.

DiscourseAi::Translation: فشل في ترجمة الموضوع رقم 5898 إلى zh_TW: {“error”:{“message”:"تم الوصول إلى حد معدل الاستخدام لنموذج openai/gpt-oss-120b في المنظمة org_01kccx1baz5sXXX ضمن فئة الخدمة on_demand من حيث الرموز يوميًا (TPD): الحد 200000، تم استخدام 193366، والطلب 7514. يرجى المحاولة مرة أخرى خلال 6 دقائق و20.16 ثانية.

الموضوع نفسه يستمر في استهلاك كل حد الرموز اليومي. لا أستطيع فهم سبب وقوع موضوع واحد في حلقة مفرغة؟

هل قمت بتعطيل التفكير لهذا النموذج اللغوي؟ جرب ذلك.

عندما تقول “التفكير”، هل تقصد “الرؤية”؟ لا أرى أي مربع اختيار أو خيار للتفكير في صفحة تكوين نموذج اللغة الكبير (LLM) في Discourse.

أتساءل عن تأثير ذلك على الترجمات؟

عُلِّق الأمر على هذه الصفحة طوال الأسبوع الماضي، مستهلكًا كل الرموز اليومية:

Embedded Subtitles with MP4 Unprocessed - General Support / Questions - MCEBuddy

DiscourseAi::Translation: فشل في ترجمة الموضوع 5898 إلى الفرنسية: {“error”:{“message”:“تم الوصول إلى حد المعدل للنموذج openai/gpt-oss-120b في المنظمة org_01kccx1be8fffaz5sbe17 ضمن فئة الخدمة on_demand من حيث الرموز يوميًا (TPD): الحد 200000، تم استخدام 197080، والمطلوب 7512. يرجى المحاولة مرة أخرى خلال 33 دقيقة و3.744 ثانية.”}

هل تقصد الجهد الاستنتاجي أم الرؤية؟


@Falco إذا قمت بتعيين جهد الاستدلال إلى “لا شيء”، أحصل على هذه الرسالة:

DiscourseAi::Translation: فشل في ترجمة الموضوع 5898 إلى fr: {“error”:{“message”:“reasoning_effort يجب أن يكون أحد القيم التالية: low، medium، أو high”,“type”:“invalid_request_error”}}

إلى أي إعداد تشير؟

إذن، مرّ حوالي 24 ساعة الآن، ولا أرى أي نشاط للترجمات في السجلات، لا أخطاء ولا نجاحات خلال الـ24 ساعة الماضية.

ومع ذلك، فإن لوحة التحكم تُظهر أن الترجمات غير مكتملة.

لقد حاولت تعطيل وإعادة تمكين مفتاح التبديل للترجمات التلقائية، لكن ذلك لم يُحدث أي فرق.

عندما أفحص مخطط جدولة Sidekiq، أرى فقط هذه المهمة الواحدة المتعلقة بالترجمات:
image

لقد حاولت تشغيلها يدويًا، لكن لم يكن هناك أي تقدم في الترجمات ولا أخطاء في السجلات أيضًا.

لماذا قد تتعطل الترجمات؟

من خلال ما أتذكره من تصحيح مشكلة مماثلة لعميل، لا يمكنك ببساطة استخدام نموذج تفكير للكشف عن اللغة.

نحن لا نستخدم مخرجات منظمة في هذا السياق، مما يعني أننا حساسون للغاية لكيفية ظهور المخرجات. فكتل التفكير تكسر ذلك بنسبة 100%، وبدون كشف اللغة، تعلق الترجمة دائمًا.

لذا، إذا فهمت ذلك بشكل صحيح، سنحتاج إلى استخدام نموذج غير تفكيري لترجمة الذكاء الاصطناعي.