Длина вашего поста в токенах по данным некоторых токенизаторов:
OpenAI: 45
Mixtral: 52
Gemini: 47
E5: 50
bge-large-en: 49
bge-m3: 50
mpnet: 49
Похоже, что Mistral-embed не сильно отличается от остальных. А так как он поддерживает очень большое окно контекста в 8 тыс. токенов, вы можете смело выбрать любой из них, ограничив окно контекста в Discourse до 7 или 7,5 тыс. токенов, чтобы оставить запас.