Como implementar Mistral com Embeddings

RGJ · Abril 9, 2025, 3:36pm

Tenho tido dificuldades para configurar Embeddings com a Mistral AI, suspeito que seja porque a Mistral requer que um modelo seja passado. Você sabe se isso é possível (e, em caso afirmativo, como), ou o que deve ser feito para torná-lo possível?

Falco · Abril 9, 2025, 3:42pm

Tente definir mistral-embed no campo “Nome do modelo”, que aparece após selecionar “Provedor” como OpenAI.

RGJ · Abril 10, 2025, 6:32pm

Obrigado, isso funciona

Estou com dificuldades para descobrir qual seria o melhor tokenizador a usar para este caso de uso. O tokenizador Mixtral não pode ser selecionado aqui. Você tem alguma sugestão?

Falco · Abril 10, 2025, 7:00pm

O comprimento do seu post acima em tokens, de acordo com alguns tokenizadores:

OpenAI: 45
Mixtral: 52
Gemini: 47
E5: 50
bge-large-en: 49
bge-m3: 50
mpnet: 49

Parece que Mistral-embed não difere muito dos outros. E como ele suporta uma janela de contexto muito grande de 8k, você deve ficar seguro escolhendo qualquer um e deixando um espaço de sobra limitando a janela de contexto no Discourse para 7 ou 7,5k.

Falco · Abril 11, 2025, 2:04pm

Parece que o mistral-embed usa o mesmo tokenizador do primeiro modelo Mixtral, e nós já o disponibilizamos de qualquer forma, então o que você acha de ativar esse tokenizador na página de configuração de embeddings @Roman_Rizzi ?

Roman · Abril 11, 2025, 2:44pm

Claro. Não vejo por que não, se já está lá. Esta alteração adicionará às opções disponíveis:

RGJ · Maio 11, 2025, 2:44pm

Este tópico foi fechado automaticamente 30 dias após a última resposta. Novas respostas não são mais permitidas.

Tópico		Respostas	Visualizações
Support for Mistral API Feature ai	1	535	26 de Dezembro de 2023
Self-Hosting Embeddings for DiscourseAI Self-Hosting ai-search , ai , related-topics	21	2492	14 de Abril de 2025
Can´t set ai embedding model Support ai	4	117	16 de Julho de 2025
Warning of embedding `input must have less than 8192 tokens` with discourse ai Support ai	5	127	3 de Novembro de 2025
Embedding of post is not being properly truncated in discourse-ai plugin Bug ai	5	416	20 de Agosto de 2023

Como implementar Mistral com Embeddings

Tópicos relacionados