Iniezione di prompt per LLM a lungo contesto come alternativa a RAG?

sam · 23 Maggio 2024, 2:58am

Sì, abbiamo una logica di troncamento che dipende dalla quantità di token consentiti dall’LLM, abbiamo impostato la soglia piuttosto alta per i modelli gemini 1.5 (a 800k)

Dovrebbe funzionare, ma ogni interazione può essere molto costosa.

Nel complesso ho scoperto che limitare il contesto aiuta i modelli a rimanere più concentrati, ma a lungo termine (tra 2-5 anni)… il RAG potrebbe essere inutile e avremo così tanti token e concentrazione che non avrà importanza.

Argomento		Risposte	Visualizzazioni
Engineering a persona to lean on chat history Support ai	8	233	Agosto 11, 2025
Why is my AI forum helper struggling to answer questions? Support ai , ai-bot	4	406	Ottobre 15, 2025
Another added context for AI Bot Support ai-bot , ai	1	76	Luglio 4, 2025
RAG capacities of discourse-ai Support ai	7	418	Settembre 19, 2024
Discourse AI Persona, upload support Announcements ai-bot , ai	21	1711	Settembre 11, 2025

Iniezione di prompt per LLM a lungo contesto come alternativa a RAG?

Argomenti correlati