针对长上下文LLMs的提示注入作为RAG的替代方案？

StevePlex · 2024 年5 月 24 日 21:02

脚注：

我能够使用 GPT4o（128k 上下文）重新运行上述测试，并确保使用大型令牌/块设置。但对于我的白皮书问答用例来说，它仍然非常不稳定（中间丢失、末尾丢失等）。如果有人想复制和改进，以下是我的设置。如果我们能为这个用例找到合适的设置，我将非常高兴：

|自定义AI角色||
|—|—||
|||
|启用？|是|
|优先级|是|
|允许聊天|是|
|允许提及|是|
|视觉启用|否||
|||
|名称|Rag 测试机器人 3|
|描述|测试 RAG 与长上下文提示注入|
|默认语言模型|GPT-4o-custom|
|用户| Rag_Testing_Bot_bot|
|已启用命令|Categories, Read, Summary|
|允许的组|trust_level_4||
|||
|系统提示|根据 Equatic 碳移除研究提供的上下文，尽可能全面地回答。不要编造内容。不要使用此会话外部的内容。尽可能准确、完整地根据提供的内容创建答案。|
|||
|最大上下文帖子数|50|
|温度|0.1|
|Top P|1||
|||
| ||
|上传| Equatics-paper1-with-unique-haystack-needles-v116.txt|
|||
|上传块令牌数|1024|
|上传块重叠令牌数|10|
|搜索对话块数|10|
|用于问题整合器的语言模型|GPT-4o-custom||
|||
|自定义机器人||
|||
|显示名称|GPT-4o-custom||
|||
|模型名称|gpt-4o||
|||
|托管模型的服务|OpenAI|
|托管模型的服务 URL|https://api.openai.com/v1/chat/completions|
|托管模型的服务 API 密钥|D20230943sdf_fake_Qqxo2exWa91||
|||
|分词器|OpenAITokenizer|
|提示的令牌数|30000|

话题		回复	浏览量
Engineering a persona to lean on chat history Support ai	8	233	2025 年8 月 11 日
Why is my AI forum helper struggling to answer questions? Support ai , ai-bot	4	406	2025 年10 月 15 日
Another added context for AI Bot Support ai-bot , ai	1	76	2025 年7 月 4 日
RAG capacities of discourse-ai Support ai	7	418	2024 年9 月 19 日
Discourse AI Persona, upload support Announcements ai-bot , ai	21	1711	2025 年9 月 11 日

针对长上下文LLMs的提示注入作为RAG的替代方案？

相关话题