Инъекция промптов для LLM с длинным контекстом как альтернатива RAG?

sam · 23.Май.2024 02:58:18

Да, у нас есть логика усечения, которая зависит от количества токенов, разрешённых LLM. Для моделей Gemini 1.5 мы установили порог довольно высоко (до 800 тысяч).

Это должно работать, но каждое взаимодействие может быть очень дорогим.

В целом я обнаружил, что ограничение контекста помогает моделям оставаться более сфокусированными, но в долгосрочной перспективе (через 2–5 лет) RAG может оказаться бессмысленным, и у нас будет так много токенов и возможностей для фокусировки, что это перестанет иметь значение.

Тема		Ответов	Просм.
Engineering a persona to lean on chat history Support ai	8	233	11.08.2025
Why is my AI forum helper struggling to answer questions? Support ai , ai-bot	4	406	15.10.2025
Another added context for AI Bot Support ai-bot , ai	1	76	04.07.2025
RAG capacities of discourse-ai Support ai	7	418	19.09.2024
Discourse AI Persona, upload support Announcements ai-bot , ai	21	1711	11.09.2025

Инъекция промптов для LLM с длинным контекстом как альтернатива RAG?

Связанные темы