Comment mettre en œuvre Mistral avec des Embeddings

RGJ · Avril 9, 2025, 3:36

J’ai eu du mal à configurer les Embeddings avec Mistral AI, je soupçonne que Mistral nécessite qu’un modèle soit passé. Savez-vous si cela est possible (et si oui, comment), ou ce qui devrait être fait pour le rendre possible ?

Falco · Avril 9, 2025, 3:42

Essayez de définir mistral-embed dans le champ « Nom du modèle », qui apparaît après avoir sélectionné « Fournisseur » comme OpenAI.

RGJ · Avril 10, 2025, 6:32

Merci, ça fonctionne

J’ai du mal à trouver quel serait le meilleur tokenizer à utiliser pour ce cas d’utilisation. Le tokenizer Mixtral n’est pas sélectionnable ici. Avez-vous des suggestions ?

Falco · Avril 10, 2025, 7:00

La longueur de votre publication ci-dessus en tokens, selon certains tokeniseurs :

OpenAI : 45
Mixtral : 52
Gemini : 47
E5 : 50
bge-large-en : 49
bge-m3 : 50
mpnet : 49

Il semble que Mistral-embed ne diffère pas beaucoup des autres. Et comme il prend en charge une très grande fenêtre de contexte de 8k, vous devriez être tranquille en choisissant n’importe lequel et en laissant un peu de marge en limitant la fenêtre de contexte dans Discourse à 7 ou 7,5k.

Falco · Avril 11, 2025, 2:04

On dirait que mistral-embed utilise le même tokenizer que le premier modèle Mixtral, et nous l’expédions déjà de toute façon, alors que penses-tu d’activer ce tokenizer dans la page de configuration des embeddings @Roman_Rizzi ?

Roman · Avril 11, 2025, 2:44

Bien sûr. Je ne vois pas pourquoi pas si elle est déjà là. Ce changement l’ajoutera aux options disponibles :

RGJ · Mai 11, 2025, 2:44

Ce sujet a été automatiquement fermé 30 jours après la dernière réponse. De nouvelles réponses ne sont plus autorisées.

Sujet		Réponses	Vues
Support for Mistral API Feature ai	1	535	Décembre 26, 2023
Self-Hosting Embeddings for DiscourseAI Self-Hosting ai-search , ai , related-topics	21	2492	Avril 14, 2025
Can´t set ai embedding model Support ai	4	117	Juillet 16, 2025
Warning of embedding `input must have less than 8192 tokens` with discourse ai Support ai	5	126	Novembre 3, 2025
Embedding of post is not being properly truncated in discourse-ai plugin Bug ai	5	416	Août 20, 2023

Comment mettre en œuvre Mistral avec des Embeddings

Sujets connexes