Mistral を埋め込みに使用する

Mistral を埋め込みに使用する際に、別の問題に遭遇しました。

  • このトピック に従い、プロバイダーに OpenAI を選択し、Mistral のサービス URL を URL として設定します
  • トークナイザー、シーケンス長、距離関数を選択します
  • モデル名を ‘mistral-embed’ に設定します

次元数を入力すると、Mistral がそれをサポートしていないとしてエラーを返します

 Trying to contact the model returned this error: {{
   "object":"error",
   "message":{
      "detail":[
         {
            "type":"extra_forbidden",
            "loc":[
               "body",
               "dimensions"
            ],
            "msg":"Extra inputs are not permitted",
            "input":2000
         }
      ]
   },
   "type":"invalid_request_error",
   "param":null,
   "code":null,
   "raw_status_code":422
}

これは、Mistral がこれを output_dimension と呼んでいるため、完全に OpenAI と互換性がないことが原因です。

dimensions パラメータを省略すると、「テスト実行」は機能しますが、モデルを保存できなくなります。「dimensions」は必須パラメータであるというエラーが表示されます。

Mistral を使用できることは GDPR 準拠のために非常に重要です。そのため、dimensions パラメータを省略できるようにする(簡単な修正)か、Mistral を第一級のプロバイダーとして扱う(より良い解決策)ことが望ましいです。