استخدم Mistral للتضمينات

لقد واجهنا مشكلة أخرى عند استخدام Mistral للتضمينات (embeddings).

  • وفقًا لـ هذا الموضوع، استخدم OpenAI كمزود وادخل عنوان URL لخدمة Mistral كموقع URL.
  • اختر الممكّن (tokenizer)، وطول التسلسل، ودالة المسافة.
  • اضبط اسم النموذج على ‘mistral-embed’.

عند إدخال قيمة للبعد (dimension)، يظهر خطأ من Mistral مفاده عدم دعم هذا البعد.

 Trying to contact the model returned this error: {{
   "object":"error",
   "message":{
      "detail":[
         {
            "type":"extra_forbidden",
            "loc":[
               "body",
               "dimensions"
            ],
            "msg":"Extra inputs are not permitted",
            "input":2000
         }
      ]
   },
   "type":"invalid_request_error",
   "param":null,
   "code":null,
   "raw_status_code":422
}

ويرجع ذلك إلى أن Mistral يسمي هذا الحقل output_dimension، لذا فهو ليس متوافقًا تمامًا مع OpenAI.

عندما أترك معامل dimensions فارغًا، تعمل وظيفة “تشغيل الاختبار”، لكنها تمنعني أيضًا من حفظ النموذج، حيث تُخبرني بأن “dimensions” معامل مطلوب.

إن القدرة على استخدام Mistral أمر بالغ الأهمية للامتثال للـ GDPR، لذا سيكون من الجيد إمكانية حذف معامل dimensions (إصلاح سهل) أو جعل Mistral مزودًا من الدرجة الأولى (أفضل).