استخدم Mistral للتضمينات

واجهنا مشكلة أخرى عند استخدام Mistral للتضمينات.

  • وفقًا لـ هذا الموضوع، استخدم OpenAI كجهة موفرة وعنوان URL الخاص بخدمة Mistral كـ URL.
  • اختر المرمّز (tokenizer)، وطول التسلسل، ودالة المسافة.
  • اضبط اسم النموذج إلى ‘mistral-embed’.

عند إدخال قيمة للبعد، يعترض Mistral لعدم دعمه لذلك:

 Trying to contact the model returned this error: {{
   "object":"error",
   "message":{
      "detail":[
         {
            "type":"extra_forbidden",
            "loc":[
               "body",
               "dimensions"
            ],
            "msg":"Extra inputs are not permitted",
            "input":2000
         }
      ]
   },
   "type":"invalid_request_error",
   "param":null,
   "code":null,
   "raw_status_code":422
}

السبب في ذلك هو أن Mistral يسمي هذا الحقل output_dimension، لذا فهو غير متوافق تمامًا مع OpenAI.

عند حذف معلمة dimensions، يعمل زر “تشغيل الاختبار”، لكنه يمنعني أيضًا من حفظ النموذج، حيث يُخبرني بأن “dimensions” معلمة مطلوبة.

إن القدرة على استخدام Mistral أمر بالغ الأهمية للامتثال للائحة العامة لحماية البيانات (GDPR)، لذا سيكون من الجيد إذا أمكن حذف معلمة الأبعاد (إصلاح بسيط) أو جعل Mistral مزوّدًا من الدرجة الأولى (أفضل).

4 إعجابات

يُجيز الاختبار بالنسبة لي مع هذا الإعداد، الذي اتبعت فيه وثائقهم

ومع ذلك، أوصي باستخدام نموذج يحقق درجات أفضل، مثل نموذج التضمين Qwen 3، والعديد من النماذج المُدربة بدقة المستمدة منه.

إنه ليس اللعبة الوحيدة المتوافقة مع الـ GDPR في السوق، رغم أنه قد يكون أول ما يخطر ببال الناس؟

توفر OpenRouter قائمة: Models | OpenRouter ويمكن للأفراد أيضًا استضافة نموذج التضمين الخاص بهم ذاتيًا؛ فهذا أمر قابل للتنفيذ للغاية، وأسهل بكثير من استضافة نماذج LLM ذاتيًا.

3 إعجابات