Injeção de prompt para LLMs de longo contexto como alternativa ao RAG?

sam · Maio 23, 2024, 2:58am

Sim, temos lógica de truncamento que depende da quantidade de tokens que o llm permite, definimos o limite bem alto para os modelos gemini 1.5 (em 800k)

Deve funcionar, mas cada interação pode ser muito cara.

No geral, descobri que limitar o contexto ajuda os modelos a se manterem mais focados, mas a longo prazo (daqui a 2-5 anos)… o rag pode ser inútil e teremos tantos tokens e foco que não importará.

Tópico		Respostas	Visualizações
Engineering a persona to lean on chat history Support ai	8	233	11 de Agosto de 2025
Why is my AI forum helper struggling to answer questions? Support ai , ai-bot	4	406	15 de Outubro de 2025
Another added context for AI Bot Support ai-bot , ai	1	76	4 de Julho de 2025
RAG capacities of discourse-ai Support ai	7	418	19 de Setembro de 2024
Discourse AI Persona, upload support Announcements ai-bot , ai	21	1711	11 de Setembro de 2025

Injeção de prompt para LLMs de longo contexto como alternativa ao RAG?

Tópicos relacionados