Prompt-Injection für LLMs mit langem Kontext als Alternative zu RAG?

sam · 23. Mai 2024 um 02:58

Ja, wir haben eine Trunkierungslogik, die von der Anzahl der Tokens abhängt, die das LLM zulässt. Wir haben den Schwellenwert für Gemini 1.5-Modelle recht hoch angesetzt (bei 800.000).

Es sollte funktionieren, aber jede Interaktion kann sehr teuer werden.

Insgesamt habe ich festgestellt, dass die Begrenzung des Kontexts den Modellen hilft, fokussierter zu bleiben, aber langfristig (in 2-5 Jahren) … könnte RAG sinnlos werden und wir werden einfach so viele Tokens und Fokus haben, dass es keine Rolle mehr spielt.

Thema		Antworten	Aufrufe
Engineering a persona to lean on chat history Support ai	8	233	11. August 2025
Why is my AI forum helper struggling to answer questions? Support ai , ai-bot	4	406	15. Oktober 2025
Another added context for AI Bot Support ai-bot , ai	1	76	4. Juli 2025
RAG capacities of discourse-ai Support ai	7	418	19. September 2024
Discourse AI Persona, upload support Announcements ai-bot , ai	21	1711	11. September 2025

Prompt-Injection für LLMs mit langem Kontext als Alternative zu RAG?

Verwandte Themen