¿Inyección de prompts para LLMs de contexto largo como alternativa a RAG?

sam · 23 Mayo, 2024 02:58

Sí, tenemos lógica de truncamiento que depende de la cantidad de tokens que permite el llm, establecimos el umbral bastante alto para los modelos gemini 1.5 (en 800 k)

Debería funcionar, pero cada interacción puede ser muy cara.

En general, he descubierto que limitar el contexto ayuda a los modelos a mantenerse más enfocados, pero a largo plazo (dentro de 2-5 años)… rag puede ser inútil y simplemente tendremos tantos tokens y enfoque que no importará.

Tema		Respuestas	Vistas
Engineering a persona to lean on chat history Support ai	8	233	11 Agosto 2025
Why is my AI forum helper struggling to answer questions? Support ai , ai-bot	4	406	15 Octubre 2025
Another added context for AI Bot Support ai-bot , ai	1	76	4 Julio 2025
RAG capacities of discourse-ai Support ai	7	418	19 Septiembre 2024
Discourse AI Persona, upload support Announcements ai-bot , ai	21	1711	11 Septiembre 2025

¿Inyección de prompts para LLMs de contexto largo como alternativa a RAG?

Temas relacionados