Mistral を埋め込みに使用

Mistral を埋め込みに使用して、別の問題に遭遇しました。

  • このトピック に従い、プロバイダーに OpenAI を、サービス URL に Mistral の URL を指定してください
  • トークナイザー、シーケンス長、距離関数を選択
  • モデル名を ‘mistral-embed’ に設定

次元数を入力すると、Mistral がそれをサポートしていないとしてエラーを返します。

 Trying to contact the model returned this error: {{
   "object":"error",
   "message":{
      "detail":[
         {
            "type":"extra_forbidden",
            "loc":[
               "body",
               "dimensions"
            ],
            "msg":"Extra inputs are not permitted",
            "input":2000
         }
      ]
   },
   "type":"invalid_request_error",
   "param":null,
   "code":null,
   "raw_status_code":422
}

これは、Mistral がこれを output_dimension と呼んでいるため、完全に OpenAI と互換性がないことが原因です。

dimensions パラメータを省略すると、「テスト実行」は機能しますが、モデルの保存ができず、「dimensions」は必須パラメータであるというエラーが表示されます。

GDPR 準拠の観点から Mistral の利用は非常に重要であるため、dimensions パラメータを省略できるようにする(簡単な修正)か、Mistral をファーストクラスのプロバイダーとしてサポートすること(より良い解決策)が望ましいです。

「いいね!」 4

この設定では、私の環境でテストに合格しました。これは彼らのドキュメントに従って行ったものです。

ただし、より高いスコアを出すモデル、例えば Qwen 3 の埋め込みモデルや、そこから派生した多数のファインチューニングモデルの使用をお勧めします。

GDPR 準拠の選択肢は Mistral だけではありません。ただし、人々が最初に思い浮かぶのはおそらくそれでしょう?

OpenRouter にはリストがあります Models | OpenRouter をセルフホストするよりもはるかに簡単です。

「いいね!」 3