長文脈LLMにおけるプロンプトインジェクションはRAGの代替となりうるか？

sam · 2024 年 5 月 23 日午前 2:58

はい、LLMが許可するトークン量に依存する切り捨てロジックがあります。Gemini 1.5モデルではしきい値をかなり高く（800kに）設定しています。

機能するはずですが、すべてのやり取りが非常に高価になる可能性があります。

全体的に、コンテキストを制限することはモデルの集中力を維持するのに役立つことがわかりましたが、長期（2〜5年後）では…RAGは無意味になり、トークンとフォーカスが非常に多くなり、問題にならなくなるでしょう。

トピック		返信	表示
Engineering a persona to lean on chat history Support ai	8	233	2025 年 8 月 11 日
Why is my AI forum helper struggling to answer questions? Support ai , ai-bot	4	406	2025 年 10 月 15 日
Another added context for AI Bot Support ai-bot , ai	1	76	2025 年 7 月 4 日
RAG capacities of discourse-ai Support ai	7	418	2024 年 9 月 19 日
Discourse AI Persona, upload support Announcements ai-bot , ai	21	1711	2025 年 9 月 11 日