Cómo implementar Mistral con Embeddings

RGJ · 9 Abril, 2025 15:36

He estado luchando para configurar Embeddings con Mistral AI, sospecho que es porque Mistral requiere que se pase un modelo. ¿Sabes si esto es posible (y si es así, cómo), o qué se debería hacer para que sea posible?

Falco · 9 Abril, 2025 15:42

Intenta configurar mistral-embed en el campo “Nombre del modelo”, que aparece después de seleccionar “Proveedor” como OpenAI.

RGJ · 10 Abril, 2025 18:32

Gracias, eso funciona

Sin embargo, me cuesta averiguar qué tokenizador sería el mejor para este caso de uso. El tokenizador de Mixtral no se puede seleccionar aquí. ¿Tienes alguna sugerencia?

Falco · 10 Abril, 2025 19:00

La longitud de su publicación anterior en tokens según algunos tokenizadores:

OpenAI: 45
Mixtral: 52
Gemini: 47
E5: 50
bge-large-en: 49
bge-m3: 50
mpnet: 49

Parece que Mistral-embed no difiere mucho de los demás. Y dado que admite una ventana de contexto muy grande de 8k, debería estar seguro de elegir cualquiera y dejar algo de margen limitando la ventana de contexto en Discourse a 7 o 7.5k.

Falco · 11 Abril, 2025 14:04

Parece que mistral-embed utiliza el mismo tokenizador que el primer modelo Mixtral, y ya lo enviamos de todas formas, así que ¿qué te parece habilitar ese tokenizador en la página de configuración de embeddings @Roman_Rizzi?

Roman · 11 Abril, 2025 14:44

Claro. No veo por qué no, si ya está ahí. Este cambio lo añadirá a las opciones disponibles:

RGJ · 11 Mayo, 2025 14:44

Este tema se cerró automáticamente 30 días después de la última respuesta. Ya no se permiten nuevas respuestas.

Tema		Respuestas	Vistas
Support for Mistral API Feature ai	1	535	26 Diciembre 2023
Self-Hosting Embeddings for DiscourseAI Self-Hosting ai-search , ai , related-topics	21	2491	14 Abril 2025
Can´t set ai embedding model Support ai	4	117	16 Julio 2025
Warning of embedding `input must have less than 8192 tokens` with discourse ai Support ai	5	126	3 Noviembre 2025
Embedding of post is not being properly truncated in discourse-ai plugin Bug ai	5	416	20 Agosto 2023

Cómo implementar Mistral con Embeddings

Temas relacionados