رسم بياني لتقدم ترجمة الذكاء الاصطناعي

تفعيلتُ الترجمات بالذكاء الاصطناعي على خادم Discourse المستضاف ذاتيًا في يوم أمس. كل شيء يسير على ما يرام… إلى حدٍ ما.

رسم بياني لتقدم الترجمة إما لا يتم تحديثه أو غير دقيق. هذا ما أراه:

وهذا يشير إلى أنني وصلت إلى نسبة 99% لجميع المنشورات منذ 23 فبراير 2026.

هذا غير دقيق. لديّ حوالي 3,000 منشور خلال هذه الفترة الزمنية. بناءً على سجلات الترجمة، فهو يعمل حاليًا على منشورات من قبل حوالي 6 أيام.

إذًا، هل يعرف أحد:

  • ما هو معدل التحديث لهذا الرسم البياني؟
  • استعلام مستكشف البيانات للمنشورات في انتظار الترجمة؟
  • استعلام مستكشف البيانات للمنشورات التي تمت ترجمتها؟
  • استعلام مستكشف البيانات للمنشورات التي حاولت ترجمتها لكنها فشلت بسبب خطأ أو سبب ما.

شكرًا مقدّمًا.

لقد اضطررنا إلى تخزين هذه الصفحة مؤقتًا (كاش) لأنها كانت تتعطل بسبب انتهاء المهلة الزمنية على المواقع الكبيرة.

تتكون الترجمة في الأساس من خطوتين:

  1. اكتشاف اللغة الأصلية للمنشور
  2. الترجمة إلى جميع اللغات الأخرى

في البداية، ستكون موقعك عالقًا بشكل أساسي في الخطوة الأولى، والتي أظهرناها في البداية في صفحة تقدم الترجمة، لكننا أزلناها لاحقًا لأن التعليقات أشارت إلى أنها “تقدم معلومات كثيرة جدًا”.

ومع ذلك، هذه ملاحظات جيدة. إن تخزين صفحة التقدم مؤقتًا وعدم وجود معلومات حول اكتشاف اللغة المحلية (Locale) يجعل التجربة سيئة للغاية في بداية العملية.

أخيرًا، قمنا بتعيين معدل الملء الخلفي (Backfill) بشكل محافظ جدًا، وقد ترغب في زيادته وفقًا لميزانيتك.

أقترح النظر في نهج أبسط للإبلاغ.

بناءً على فهمي، تعمل عملية الترجمة على مرحلتين:

  1. ترجمة بيانات المواضيع المؤهلة.
  2. ترجمة بيانات المشاركات المؤهلة.

من منظور إداري وتقارير، لست مهتمًا كثيرًا بما هو قيد التنفيذ حاليًا، بل أكثر اهتمامًا بالتقدم العام مقابل حجم العمل المؤهل. أفضل أن أرى التقارير مبنية على قواعد أهلية الترجمة المكونة.

على سبيل المثال:

الحالة

تم تكوين إعدادات الملء الخلفي لترجمة جميع المحتويات التي تم إنشاؤها بعد 23 فبراير 2026.

المنطقة الإجمالي المؤهل مترجم مكتمل
مواضيع 25,000 540 450 83%
مشاركات 400,000 3,700 800 22%

الترجمات الفاشلة

معرف المشاركة السبب
34543 أحرف غير سليمة في السطر xxxx

يبدو أن الرسم البياني الحالي يعرض النشاط التشغيلي، وهو أمر مفيد بالتأكيد. ومع ذلك، ما أريد فهمه حقًا هو مقدار العمل المؤهل الذي تم إنجازه.

بشأني الشخصي، لست مهتمًا جدًا بنسب الإكمال حسب اللغة. الموضوع أو المشاركة إما أن يكون مترجمًا أو لا. السؤال الرئيسي بالنسبة لي هو مقدار الخلفية المكونة التي تمت معالجتها بنجاح.

يبدو أن هذا النهج سيكون أيضًا أكثر ودية لقاعدة البيانات، حيث يركز على الأعداد الإجمالية بدلاً من تتبع التقدم عبر كل مجموعة لغوية.

إذا كان الإبلاغ المحدد حسب اللغة لا يزال ذا قيمة، فربما يمكن عرضه من خلال عامل تصفية. يمكن للمسؤول اختيار لغة وعرض جدول التقدم نفسه لتلك اللغة فقط.

بعض الأفكار فقط.

ملاحظة:

ما هو إطار الوقت الحالي للتخزين المؤقت؟