Injection de prompt pour les LLM à long contexte comme alternative au RAG ?

sam · Mai 23, 2024, 2:58

Oui, nous avons une logique de troncature qui dépend de la quantité de jetons autorisée par le LLM, nous avons défini le seuil assez haut pour les modèles gemini 1.5 (à 800k)

Cela devrait fonctionner, mais chaque interaction peut être très coûteuse.

Dans l’ensemble, j’ai constaté que limiter le contexte aide les modèles à rester plus concentrés, mais à long terme (dans 2 à 5 ans)… le RAG pourrait être inutile et nous aurons tellement de jetons et de concentration que cela n’aura pas d’importance.

Sujet		Réponses	Vues
Engineering a persona to lean on chat history Support ai	8	233	Août 11, 2025
Why is my AI forum helper struggling to answer questions? Support ai , ai-bot	4	406	Octobre 15, 2025
Another added context for AI Bot Support ai-bot , ai	1	76	Juillet 4, 2025
RAG capacities of discourse-ai Support ai	7	418	Septembre 19, 2024
Discourse AI Persona, upload support Announcements ai-bot , ai	21	1711	Septembre 11, 2025

Injection de prompt pour les LLM à long contexte comme alternative au RAG ?

Sujets connexes