لقد انتهيت للتو من إعداد discourse-ai، أتساءل ما هي قدرات RAG للذكاء الاصطناعي؟
أرى أنه يمكنه استرداد المحتوى من المنشورات ولكن يجب أن أسأله عدة مرات قبل أن يفهم حقًا أنه يجب العثور على المعلومات داخل موضوع.
الميزات الأخرى تعمل بشكل جيد!
تحتوي الشخصية على قسم تحميل، يمكنك تحميل ملفات نصية متعددة إلى شخصيتك.
انظر: AI bot - Personas
ستحتاج إلى تكوين التضمين لكي يعمل هذا.
شكرًا، لقد رأيت هذا القسم، هذا رائع، ولكن لا يزال لدي بعض الأسئلة.
بعض السياق: نستخدم discourse كقاعدة معرفية ومنتدى للإجابة على الأسئلة التقنية، ولدينا كل وثائقنا عليه.
سنستخدم قسم التحميل في persona لتغذية البيانات التي لا نضعها مباشرة في المنتدى، مثل البيانات من المستندات حول شركتنا.
الآن، بالنسبة لوثائقنا التقنية التي تعيش في المنتدى، نود أن نكون قادرين على طرح أسئلة عليها باستخدام الذكاء الاصطناعي. حسب فهمي، فإن دردشة discourse-AI ليست مخصصة لهذا، وكما تم تكوينها في أدوات persona، فإنها ستقوم فقط بالبحث في المنتدى، بالإضافة إلى بعض معالجة الذكاء الاصطناعي؟
هل هذا شيء مخطط له ليكون لديك روبوت محادثة يتيح إمكانيات RAG على المنتدى نفسه، بما في ذلك محتوى المواضيع؟
هذا مدعوم بنسبة 100% اليوم مع عدد لا يحصى من خيارات التنفيذ.
- يمكن تحديد نطاق أداة البحث لمجموعة من الفئات أو العلامات (عند إنشاء شخصية جديدة وإضافة أداة البحث)
- توفر الأدوات المخصصة مرونة إضافية هنا، يمكنك إجراء طلبات HTTP إلى نفس المنتدى واستهلاك أي شيء من المنتدى بأي تنسيق تريده… بما في ذلك طلبات HTTP للبحث المضمن… انظر: API access to the embedding(s) for a post - #3 by sam. عند إجراء طلبات HTTP في أداة مخصصة، يمكنك تحديد رؤوس HTTP حتى تتمكن من استخدام مفتاح API تصدره على المنتدى.
- تسمح لك أداة القراءة بقراءة المواضيع
- سيسمح لك هذا السحب قيد العمل بالبحث في تحميلاتك مباشرة من أداة. (FEATURE: RAG search within tools by SamSaffron · Pull Request #802 · discourse/discourse-ai · GitHub) وهو خيار آخر.
- يمكنك التحكم في الوسائط (رسائل خاصة مقابل دردشة) حسب تفضيلك
يمكنك رؤية مثال للتنفيذ على ask.discourse.com (والذي تم تصميمه كبوت دعم لعملائنا) - أهم شيء هو أنه لا يتضمن أي مكون إضافي مخصص، بل يستخدم المكون الإضافي Discourse AI المدمج.
إخلاء مسؤولية: أنا مستخدم فعلي ولا أفهم حتى كيف تعمل الذكاء الاصطناعي حقًا. وأنا أستخدم OpenAI.
هناك بعض الأسباب التي تجعل الذكاء الاصطناعي لا يعطي الإجابة المطلوبة.
- يحدد التوجيه المكان الذي يمكنه البحث فيه وكيفية البحث. كلمة واحدة خاطئة وسيفعل ما يريد.
- الذكاء الاصطناعي ليس مثل جوجل مع المنشطات والمهارة لشرح الأشياء، حتى لو كان كذلك نوعًا ما. يمكنه العثور على النتائج الصحيحة أيضًا، وأعني ذلك بنفس السوء، مثل جوجل. وهو لا يقرأ ويحلل كل شيء بالفعل، ولكنه فقط… يعتقد ذلك.
- تعمل RAG والتضمينات، ولكنها تتطلب توجيهًا صارمًا للغاية. ولكن هذه تعطي اتجاهًا فقط، وغالبًا ما لا تكون أساسًا ثابتًا لبناء إجابة. التضمينات وحدها تتطلب الكثير من العمل اليدوي وغالبًا ما تكون الموضوعات، مرة أخرى بحد ذاتها، غير كافية. يمكن أن يكون الموضوع أو المنشور (وهو أسوأ) دقيقًا ومنطقيًا بما فيه الكفاية، ولكن في الحياة الواقعية؟ لا. لهذا السبب يفشل ask.discourse.com في كثير من الأحيان، إذا لم يتم طرح سؤال محدود وموجه للغاية. كيف أسمح بنطاقات بريد إلكتروني محددة فقط في التسجيلات؟ بووم، لديك الإجابة. كيف أحصل على إشعارات عندما يحتوي صندوق رسائل جماعية على رسائل جديدة؟ الكثير من الهلوسة والمراجع الخاطئة.
الفكرة الأكثر إزعاجًا من OpenAI هي أن الإجابات الخاطئة مقبولة. إنها مسألة كمية وخاصة كم ستكلف تلك الإجابات المخلوقة والخاطئة واقعيًا شركة ما.
صحيح جدًا للشركات، ولكنه سيء حقًا للمستخدم الفردي.
يمكن أن تكون الذكاء الاصطناعي دقيقة جدًا. كل ما هو مطلوب هو الكثير من القوى العاملة للترميز والعناية بذلك، والكثير من قوة الحوسبة لدرجة أن تعدين البيتكوين هواية رخيصة.
نقطتي الضعيفة جدًا هي أن مجرد إسقاط الأدلة في المواضيع غير كافٍ.
هذه رؤية مهمة جدًا: أنت لا تنتهي أبدًا حقًا من هذه الأنواع من الأنظمة.
نحن نكرر عملية
- يسأل المستخدم الذكاء الاصطناعي ويحصل على إجابة سيئة
- نقوم بالمراجعة
- إصلاح الوثائق، وقبول إجابة صحيحة، وحذف ألغام البحث
- طرح نفس السؤال والحصول على إجابة صحيحة
هذه ليست الأنواع من الأنظمة التي يمكنك نشرها ونسيانها؛ فهي تحتاج إلى ضبط مستمر.
لاحظ أن هذا يساعدنا كثيرًا إذا قمت بتقييم أي إجابات سيئة بالإبهام لأسفل.
هذا صحيح جدًا. وهناك احتمال كبير حقًا أن يكون توجيهي سيئًا للغاية.
ولكن … يستخدم المستخدمون النهائيون هذه الروبوتات وهم ليسوا جيدين في كتابة أسئلة عالية الجودة، مما يوجه الذكاء الاصطناعي في الاتجاه الصحيح للحصول على ما هو مطلوب. وبعد ذلك، فإن المعرفة التي اكتسبتها اليوم، على الرغم من كونها خاطئة، ستؤدي إلى جودة أفضل في مرحلة ما، ولا تساعد كثيرًا.
لا أعرف ما هي نقطتي، باستثناء أن بناء / تدريب / ضبط ذكاء اصطناعي لديه معدل نجاح يزيد عن 80٪ يتطلب المزيد من العمل والمحتوى المنسق أكثر من مجرد نشر الموضوعات. وهذا العمل يكلف المال (لذا آمل أن ينمو عملك، لأنني أحب التدقيق اللغوي، حتى لو كانت هذه الوظيفة خارج الموضوع بشكل كبير الآن).
This topic was automatically closed 30 days after the last reply. New replies are no longer allowed.