MistralをEmbeddingsで実装する方法

RGJ · 2025 年 4 月 9 日午後 3:36

Mistral AI で Embeddings を設定しようとしていますが、Mistral はモデルを渡す必要があるため、うまくいかないのではないかと疑っています。これが可能かどうか（可能であれば、どのように）、または可能にするために何をするべきかご存知ですか？

Falco · 2025 年 4 月 9 日午後 3:42

「プロバイダー」として「OpenAI」を選択した後に表示される「モデル名」フィールドに「mistral-embed」を設定してみてください。

RGJ · 2025 年 4 月 10 日午後 6:32

ありがとうございます、うまくいきました

ただ、このユースケースに最適なトークナイザーを見つけるのに苦労しています。Mixtralトークナイザーはここでは選択できません。何か提案はありますか？

Falco · 2025 年 4 月 10 日午後 7:00

一部のトークナイザーによる上記の投稿のトークン長：

OpenAI：45
Mixtral：52
Gemini：47
E5：50
bge-large-en：49
bge-m3：50
mpnet：49

Mistral-embed は他のものとあまり変わらないようです。また、8k という非常に大きなコンテキストウィンドウをサポートしているため、いずれかを選択し、Discourse のコンテキストウィンドウを 7k または 7.5k に制限することで、余裕を持たせることができます。

Falco · 2025 年 4 月 11 日午後 2:04

mistral-embedは最初のMixtralモデルと同じトークナイザーを使用しているようで、すでにそれを出荷しているため、@Roman_Rizzi さん、そのエンベディングの設定ページでそのトークナイザーを有効にすることについてどう思いますか？

Roman · 2025 年 4 月 11 日午後 2:44

はい。すでに存在しているなら、なぜそうしないのか分かりません。この変更により、利用可能なオプションに追加されます。

RGJ · 2025 年 5 月 11 日午後 2:44

このトピックは、最後の返信から30日後に自動的にクローズされました。新しい返信は許可されていません。

トピック		返信	表示
Support for Mistral API Feature ai	1	535	2023 年 12 月 26 日
Self-Hosting Embeddings for DiscourseAI Self-Hosting ai-search , ai , related-topics	21	2491	2025 年 4 月 14 日
Can´t set ai embedding model Support ai	4	117	2025 年 7 月 16 日
Warning of embedding `input must have less than 8192 tokens` with discourse ai Support ai	5	126	2025 年 11 月 3 日
Embedding of post is not being properly truncated in discourse-ai plugin Bug ai	5	416	2023 年 8 月 20 日