Si vous auto-hébergez ce même modèle, cela peut prendre jusqu’à 32k tokens.
Si cela est hors de portée, vous devez configurer le modèle d’embeddings pour limiter les entrées au maximum autorisé par votre fournisseur. De cette façon, notre bot IA RAG divisera les fichiers téléchargés en morceaux, et Related Topic / Search ne prendra que les 8192 premiers tokens de chaque sujet.