如何使用嵌入实现Mistral

我一直在努力设置 Mistral AI 的 Embeddings,我怀疑是因为 Mistral 需要传递一个模型。您知道这是否可能(如果可能,如何实现),或者应该怎么做才能实现吗?

2 个赞

在“模型名称”字段中尝试设置 mistral-embed,该字段在选择“提供商”为 OpenAI 后显示。

2 个赞

好的,这很有效 :+1:

不过,我很难弄清楚在这种用例下使用哪种分词器最好。Mixtral 分词器在这里不可选。你有什么建议吗?

根据一些分词器,您上面的帖子长度如下:

OpenAI:45
Mixtral:52
Gemini:47
E5:50
bge-large-en:49
bge-m3:50
mpnet:49

看起来 Mistral-embed 与其他分词器差别不大。而且由于它支持 8k 的非常大的上下文窗口,您可以放心地选择任何一个,并通过将 Discourse 中的上下文窗口限制为 7k 或 7.5k 来留出一些余地。

1 个赞

看来 mistral-embed 使用的分词器与第一个 Mixtral 模型相同,我们无论如何都已经提供了这个,所以你觉得在嵌入配置页面启用该分词器怎么样 @Roman_Rizzi

2 个赞

当然。如果已经存在,我不认为有什么问题。此更改将把它添加到可用选项中:

3 个赞

此主题在上次回复后 30 天自动关闭。不再允许回复。