حقن المطالبات لنماذج اللغات ذات السياق الطويل كبديل لـ RAG؟

sam · 23 مايو 2024، 2:58ص

نعم، لدينا منطق اقتطاع يعتمد على كمية الرموز التي يسمح بها نموذج اللغة الكبير (LLM)، وقد قمنا بتعيين الحد عند مستوى عالٍ جدًا لنماذج Gemini 1.5 (عند 800 ألف).

يجب أن يعمل ذلك، ولكن كل تفاعل يمكن أن يكون مكلفًا للغاية.

بشكل عام، وجدت أن تحديد السياق يساعد النماذج على البقاء أكثر تركيزًا، ولكن على المدى الطويل (2-5 سنوات قادمة)… قد يكون البحث المعزز بالاسترجاع (RAG) بلا فائدة وسيكون لدينا الكثير من الرموز والتركيز لدرجة أنه لن يكون مهمًا.

الموضوع		الردود	مرات العرض
Engineering a persona to lean on chat history Support ai	8	233	11 أغسطس 2025
Why is my AI forum helper struggling to answer questions? Support ai , ai-bot	4	406	15 أكتوبر 2025
Another added context for AI Bot Support ai-bot , ai	1	76	4 يوليو 2025
RAG capacities of discourse-ai Support ai	7	418	19 سبتمبر 2024
Discourse AI Persona, upload support Announcements ai-bot , ai	21	1711	11 سبتمبر 2025

حقن المطالبات لنماذج اللغات ذات السياق الطويل كبديل لـ RAG؟

الموضوعات ذات الصلة