نصيحة حول بوت الدعم لمنتدى الدعم الفني (Discourse AI مقابل Discourse Chatbot)

بعد الاطلاع على عدد من الموضوعات، إليك ما تعلمته وما أنصح به.

الموقع مخصص لدعم نظام أمان المنازل Surety.

الهدف من استخدام الذكاء الاصطناعي مع منتدى Discourse هو (مرجع):

  • دعم فريق الدعم البشري لدينا في منتدى الدعم الفني.
  • يجب أن يتعلم من بيانات المنتدى التاريخية.
  • أن يمتلك المعرفة المتخصصة لتقديم الدعم.
  • يجب أن يحاول الإجابة فقط على الأسئلة المتعلقة بالموضوع.
  • يجب أن يوفر للمستخدم طريقة لإخبار البوت بالتوقف عن الإجابة، ليتمكن من انتظار شخص بشري إذا شعر أن البوت لا يساعده.

وهنا بعض الأسئلة من راين:

  • هل تتعلم هذه البوتات تلقائيًا أو تُدقّق (fine-tune) باستخدام بيانات المنتدى التاريخية؟
  • عدم تكرار العمل الذي قام به أشخاص أكثر ذكاءً.
  • تقييد المواضيع التي سيتفاعل فيها البوت حتى لا يشارك في محادثات عامة أو خارجة عن الموضوع؟
  • هل يُقصد بـ Discourse Chatbot الأصلي أن يتم تطويره وصيانته على المدى الطويل؟
  • أم أنه من المخطط استبداله في النهاية ببوت الذكاء الاصطناعي في الإضافة الرسمية، أو دمجه فيه؟

إليك سؤال منشور قدمته لبوت Discourse AI المفعّل حاليًا في إصدار الموقع الذي جربته، مع إجابة من ChatGPT.

السؤال:

لدي جهاز IQP4 مع وحدة PowerG للتوصيل السلكي. تعمل المستشعرات السلكية. أردت إجراء اختبار على الجرس/الصفارة، لكن لم أتمكن من العثور على الخيار على جهاز IQP4. يمكنني اختبار الصفارة على اللوحة، فتصدر صوتًا مع جهاز IQ Remote، لكن الجرس السلكي لا يصدر صوتًا. يجب أن أشغل الإنذار لكي يصدر الجرس السلكي صوتًا.

هل هناك طريقة لاختبار الجرس على وحدة PowerG للتوصيل السلكي من جهاز IQP4؟


إليك الرد باستخدام بوت Discourse AI مع GPT-4

وجدت موضوعًا ذا صلة في منتدانا قد يساعدك في مشكلتك.

في الموضوع اختبار الجرس السلكي على PowerG للتوصيل السلكي؟، كان لدى المستخدم مشكلة مشابهة حيث لم يتمكن من العثور على خيار اختبار الجرس على وحدة PowerG للتوصيل السلكي من جهاز IQP4.

يرجى الاطلاع على هذا الموضوع للحصول على حلول محتملة. إذا كانت لا تزال لديك أسئلة أو تحتاج إلى مزيد من المساعدة، فلا تتردد في السؤال.


إليك الرد باستخدام بوت Discourse AI مع GPT-3.5

وجدت موضوعًا في منتدى دعم Surety يناقش اختبار الجرس السلكي على توصيل PowerG للتوصيل السلكي مع لوحة IQ Panel 4 (IQP4). يمكنك العثور على الموضوع هنا.

في الموضوع، ذكر المستخدم أنه لم يتمكن من العثور على خيار لاختبار الجرس/الصفارة على جهاز IQP4 نفسه. ومع ذلك، تمكن من اختبار الصفارة على اللوحة وسمع صوتها مع جهاز IQ Remote. أما الجرس السلكي، فمن ناحية أخرى، لم يصدر صوتًا إلا عند تشغيل الإنذار.

يمكنك زيارة الموضوع لمزيد من المعلومات ولرؤية ما إذا كان هناك أي حلول أو اقتراحات قدمها مستخدمون آخرون.


كلا البوتين، Discourse AI مع GPT-4 و GPT-3.5، وجدا نفس الموضوع.



إليك الرد باستخدام ChatGPT

لا أملك معلومات محددة حول أحدث إصدار من البرنامج أو ميزات لوحة IQ Panel 4، حيث تقتصر معرفتي في التدريب على يناير 2022. ومع ذلك، بناءً على المبادئ العامة لاختبار أنظمة الإنذار، إليك بعض الاقتراحات التي قد تساعدك في اختبار صفارتك السلكية المتصلة بوحدة PowerG:

  1. وضع اختبار النظام:

    • تحقق مما إذا كانت لوحة الإنذار الخاصة بك تحتوي على وضع «اختبار النظام» أو «اختبار المشي». هذا الوضع مصمم عادةً لاختبار المستشعرات والإنذارات دون تشغيل حدث إنذار حقيقي. إذا كانت لوحتك تحتوي على هذه الميزة، فيجب أن تسمح لك باختبار الصفارة دون تشغيل إنذار كامل.
  2. التحكم في المخرجات:

    • ابحث عن خيار «التحكم في المخرجات» أو «المخرج الإضافي» في إعدادات لوحة الإنذار. قد تتيح لك هذه الميزة تشغيل المخرجات يدويًا، مثل الصفارة، لأغراض الاختبار.
  3. تجاوز المنطقة:

    • تسمح بعض الأنظمة بتجاوز مناطق محددة أثناء الاختبار. إذا كانت صفارتك السلكية مرتبطة بمنطقة معينة، فقد تتمكن من تجاوز تلك المنطقة للاختبار.
  4. دليل المستخدم:

    • راجع دليل المستخدم أو الوثائق التي جاءت مع لوحة IQ Panel 4. يجب أن توفر تعليمات محددة حول كيفية اختبار والتحكم في مكونات نظام الإنذار المختلفة.
  5. الدعم الفني:

    • إذا لم تتمكن من العثور على حل بمفردك، ففكر في التواصل مع الدعم الفني للشركة المصنعة. يمكنهم تقديم إرشادات بناءً على الميزات والقدرات المحددة لنظامك.
  6. تحديث برنامج اللوحة:

    • تحقق مما إذا كانت هناك أي تحديثات برمجية متاحة لـ لوحة IQ Panel 4. غالبًا ما تطلق الشركات المصنعة تحديثات لإضافة ميزات جديدة أو معالجة المشكلات، وقد يتضمن التحديث وضع اختبار محدد للصفارة.

تذكر توخي الحذر أثناء الاختبار لتجنب تشغيل حدث إنذار حقيقي بالخطأ. إذا لم تكن متأكدًا من أي خطوة، فمن الجيد دائمًا الرجوع إلى دليل المستخدم أو الاتصال بالدعم الفني للحصول على المساعدة.

من الواضح أن ChatGPT يقدم إجابة أكثر تفصيلاً. سأنتقل إلى الأسباب المحتملة لاحقًا في هذا الموضوع.


ملاحظة: لا أملك وصولًا إلى إضافة Discourse AI من Merefield (بطاقة) (GitHub)، سيكون من الجيد رؤية رد على نفس السؤال منشور هنا للمقارنة. :slightly_smiling_face:




إليك ملاحظاتي.

تعتمد الذكاء الاصطناعي لهذه البوتات على نماذج اللغة الكبيرة (LLMs)، والمعرفة محدودة بمجموعة التدريب. كما تستخدم البوتات تقنية RAG لتعزيز معرفتها بالوصول إلى الموضوعات في المنتدى.

عادةً ما تستخدم البوتات «مطلب نظام» (system prompt)، أي شخصية افتراضية، وهو ليس مطلب مستخدم مع الطلب الموجه إلى واجهة برمجة تطبيقات LLM.

سأترك لـ ChatGPT شرح الفرق.

ChatGPT

ما هو مطلب النظام؟ وكيف يختلف عن مطلب المستخدم؟

الإكمال

مطلب النظام ومطلب المستخدم مصطلحان يُستخدمان غالبًا في سياق نماذج اللغة وأنظمة الذكاء الاصطناعي التفاعلي مثل GPT-3.5. دعني أوضح الفرق بينهما:

  1. مطلب المستخدم:

    • هو الإدخال الذي يقدمه المستخدم البشري لبدء محادثة أو طلب معلومات من نظام الذكاء الاصطناعي.
    • هو النص أو الاستعلام الذي يكتبه أو ينطق به الشخص للتفاعل مع نموذج الذكاء الاصطناعي.
    • على سبيل المثال، إذا كنت تستخدم روبوت محادثة أو نموذج لغة، فإن مدخلك الذي يسأل فيه سؤالًا أو يقدم فيه بيانًا سيكون مطلب المستخدم.
  2. مطلب النظام:

    • من ناحية أخرى، هو الإدخال الأولي أو التوجيه الممنوح لنموذج الذكاء الاصطناعي لتحديد السياق أو توجيه سلوكه للمحادثة.
    • يُستخدم لتزويد الذكاء الاصطناعي بنقطة انطلاق أو سياق لتوليد الردود.
    • يساعد مطلب النظام في تشكيل نبرة أو أسلوب أو محتوى ردود الذكاء الاصطناعي، ويعمل ك sorta توجيه لتوجيه سلوك النموذج.
    • بينما تكون مطالب المستخدم محددة لاستفسارات المستخدم أو بياناته، فإن مطالب النظام تتعلق أكثر بتقديم سياق عام أو توجيه للمحادثة بأكملها.

في حالة GPT-3.5 أو نماذج اللغة المماثلة، تبدأ المحادثة عادةً بمطلب النظام يتبعه مطالب المستخدم في تبادل مستمر. يساعد مطلب النظام في التأثير على ردود النموذج طوال المحادثة، لكن المزيج بين مطالب النظام ومطالب المستخدم هو ما يحدد مخرجات النموذج.


السبب في عدم قدرة البوتات على تقديم إجابة أكثر تحديدًا هو أن قاعدة معرفتها تفتقر إلى أدلة المستخدم، تعليمات التثبيت، وما إلى ذلك لهذه المنتجات. بالإضافة إلى ذلك، غالبًا ما تكون البوتات غير قادرة على استخراج الصور والمخططات من هذه الوثائق، مثل مخططات الأسلاك والصور المستخدمة في أدلة التثبيت.

كخطوة أولى، يجب استخدام RAG لتوسيع معرفة الذكاء الاصطناعي قدر الإمكان، حتى لو كان ذلك مقتصرًا على النص من الوثائق فقط. بينما يمكن لبوت Discourse AI استخدام RAG لجميع الموضوعات في المنتدى، لا أعرف ما إذا كانوا يسمحون بإضافة معلومات خارجية. إذا لم يكن الأمر كذلك، فإن إحدى الأفكار هي استيراد جميع الوثائق كملفات PDF في فئة، ربما مخفية، ثم يمكن لرمز Discourse الوصول إليها بسهولة أكبر لأنها موجودة في المنتدى، ثم استخدام Langchain للوصول إلى ملفات PDF (مرجع)

مع هذه المعرفة المضافة، يمكن تعديل مطلب النظام لتحسين الردود، لكن هذا سيبقى بعيدًا عن ما تبحث عنه. فغالبًا ما ستظل تحصل على ردود مثل الأولى تشير إلى معلومات ولكن دون تعليمات خطوة بخطوة عند الحاجة. أيضًا، لا توجد طريقة لتقديم ملاحظات حول رد الذكاء الاصطناعي يفهمها الذكاء الاصطناعي على أنها ملاحظات. بعبارة أخرى، إذا رد مستخدم على البوت بأن شيئًا ما خاطئ، فسيقرأ البوت الرد لكنه لن يفهم أنه يجب عليه تحديث المعرفة بناءً على ذلك.

لتحسين جودة الردود، تتبادر إلى ذهني ثلاث أفكار.

  1. استخدام HyDE (تضمينات المستندات الافتراضية)

«استرجاع كثيف دقيق بدون صفر تعليمات دون تسميات الصلة» بواسطة Luyu Gao و Xueguang Ma و Jimmy Lin و Jamie Callan (pdf)

تعلمت عن HyDE في الواقع من Discourse (مرجع) وأعلم أنهم يستخدمونه.

  1. RLHF (التعلم المعزز من الملاحظات البشرية). لا أعتقد أن أيًا من البوتين قادر على ذلك، وقد يكون Discourse يفكر في ذلك؛ أود سماع ملاحظاتهم إذا أرادوا المشاركة.

  2. بيانات اصطناعية مع RLHF. هذا حقًا في طليعة التكنولوجيا وليس شيئًا أتوقع أن يطبقه أي من البوتين.

واحدة من أكثر الطرق إثباتًا ونجاحًا لتدريب LLM هي أن تدرب نفسها بنفسها، لكنك تحتاج إلى مقياس حتى تعرف ما إذا كانت النتيجة أفضل أم أسوأ. بالنسبة لموقعك، الطريقة الوحيدة التي أفهمها حاليًا لمعرفة ما إذا كان الحل أفضل أم أسوأ هي أن يقوم شخص بشري بتقييم الحل من الذكاء الاصطناعي. للحصول على المزيد من جولات الأسئلة والحلول الممكنة، يتم توليد الأسئلة بواسطة ذكاء اصطناعي مع توليد حل بواسطة ذكاء اصطناعي آخر، ثم يتم قياس الحل واستخدامه لتحسين الذكاء الاصطناعي الذي يولد الحل.


لتحسين قدرة البوت على مساعدة المستخدمين، يجب عليه إجراء سلسلة من الأسئلة لجمع معلومات لفهم المشكلة بشكل أفضل، بطريقة مشابهة لطريقة طبيب التشخيص والتكهن.

خيار آخر هو النظر في التكنولوجيا المماثلة التي يمكن الوصول إليها عبر بوت الذكاء الاصطناعي، مثل Copilot من مايكروسوفت.

عنصر واحد لم تطلبه أو تلاحظه وهو ذو قيمة هو الإحالات إلى المصدر. السبب في أهمية هذا هو التحقق مما إذا كان إكمال الذكاء الاصطناعي هو هلوسة أم لا. إذا تم تضمين مرجع، وهو مرجع حقيقي وليس هلوسة، فيمكن التحقق من المرجع لمعرفة ما إذا كان من مصدر موثوق مثل دليل، وبالتالي يُعرف أنه ليس هلوسة. إضافة المراجع سهلة مع RAG ويجب توقعها.


الآن لمعالجة أهدافك المحددة.

دعم فريق الدعم البشري لدينا في منتدى الدعم الفني.

هذا أكثر من كونه بيانًا منه سؤالًا، لذا لن أجيب عليه كسؤال.

يجب أن يتعلم من بيانات المنتدى التاريخية.

كان هذا في الواقع جزءًا من بيان أكبر قمت بتقسيمه. السبب في أنني قمت بتقسيمه هو أنه بينما أنت محق في أن البيانات التاريخية في المنتدى ذات قيمة، فإن المعرفة الأساسية مثل تلك الموجودة في الأدلة مطلوبة أيضًا. تستخدم البوتات الحالية RAG مع منشورات المنتدى، لكن حسب علمي (AFAIK) لا تعرف كيفية الوصول إلى البيانات الخارجية.

يجب أن يحاول الإجابة فقط على الأسئلة المتعلقة بالموضوع.

يمكن تحقيق ذلك عن طريق تعديل مطلب النظام. سيتطلب ذلك أيضًا بعض التكنولوجيا في Discourse AI Post Classifier - Automation rule

يجب أن يوفر للمستخدم طريقة لإخبار البوت بالتوقف عن الإجابة، ليتمكن من انتظار شخص بشري إذا شعر أن البوت لا يساعده.

يمكن تحقيق ذلك عن طريق تعديل مطلب النظام.

هل تتعلم هذه البوتات تلقائيًا أو تُدقّق باستخدام بيانات المنتدى التاريخية؟

سؤال جيد. بينما ألمحت سابقًا إلى كيفية البدء في حل هذه المشكلة، إلا أنها في الواقع سؤال أصعب بكثير مما يبدو، لكن باحثي LLM الكبار يحققون تقدمًا أفضل بكثير في هذا المجال، وقد تكون هناك بعض الإعلانات المثيرة في الأشهر القليلة القادمة يمكن أن تجعل هذا الأمر أسهل بكثير.

عدم تكرار العمل الذي قام به أشخاص أكثر ذكاءً.

سأفهم ذلك على أن LLM لا يجب أن يحيد عما يعرفه. هذا يعتمد على كيفية تدريب النموذج على المعرفة الجديدة. من الممكن جعل النموذج أسوأ، وحتى أصعب لجعل النموذج ينسى. حسب علمي (AFAIK)، لا يمتلك أي من بوتي Discourse AI القدرة على التعلم، أي تغيير الأوزان في LLM، لكنهما يمتلكان القدرة على استخدام RAG مع منشورات الموضوع. لذا فإن منشور الموضوع السيئ، أي «مدخلات قذرة»، يمكن أن يخلق «مخرجات قذرة».

تقييد المواضيع التي سيتفاعل فيها البوت حتى لا يشارك في محادثات عامة أو خارجة عن الموضوع؟

سيكون هذا مشابهًا لـ Discourse AI Post Classifier - Automation rule

هل يُقصد بـ Discourse Chatbot الأصلي أن يتم تطويره وصيانته على المدى الطويل؟

سأترك ذلك لفريق Discourse.

أم أنه من المخطط استبداله في النهاية ببوت الذكاء الاصطناعي في الإضافة الرسمية، أو دمجه فيه؟

سأترك ذلك لفريق Discourse.

6 إعجابات