بينما كان ربط روبوت الذكاء الاصطناعي بواجهات برمجة التطبيقات الخارجية أمرًا رائعًا للغاية، أعتقد أنه سيكون من المفيد جدًا للمسؤولين/المطورين أن يكونوا قادرين على بناء سلاسل المطالبات باستخدام LCEL في محرر الأدوات المخصصة للسماح بتدفقات عمل أكثر تعقيدًا واستجابات ذكية معززة. أو ربما يمكن أن يحتوي محرر الأدوات المخصصة على وظيفة “منشئ السلاسل” التي تقوم في الأساس بتغليف LangChain في واجهة مستخدم رسومية للمسؤول .
بدلاً من ذلك، سيكون من المفيد للغاية السماح بوقت تنفيذ أطول من ثانيتين حتى يمكن استضافة سلسلة المطالبات على خوادم مختلفة وعرضها على خادم Discourse. ثانيتان كافيتان لإرسال بعض البيانات إلى السلسلة، والسماح لها “بالتفكير” عبر سلسلتها، ثم الحصول على إجابة . ولكن هذا أكثر تعقيدًا ومتخصصًا، وأقل ملاءمة لغير المهندسين. الاقتراح الأول منطقي أكثر.
بالطبع، كلا الخيارين يقدمان مخاطر محتملة، لذا من المثالي أن يكون هناك تبديل لتمكينه مع تحذير/إشعار مرفق .
ولكن لماذا نفعل هذا؟ حسنًا، يسعدني أنك سألت :D.
لا يمكن تحقيق سلوك الذكاء الاصطناعي المعقد / الوكالة حقًا باستخدام مطالبة نظام واحدة وحدها، وهذا هو السبب بالضبط الذي تم تطوير LangChain من أجله. أنا باحث في الذكاء الاصطناعي ونحن نبني بنية معرفية بسيطة (في الوقت الحالي) قائمة على نماذج اللغة الكبيرة والتي ستتفاعل في النهاية مع المستخدمين . سيكون Discourse هو الوسيط المثالي الذي يمكننا من خلاله إطلاق العنان لهذا الوحش، خاصةً أنه يمكن ربطه بمكون الأتمتة - الاحتمالات لا حصر لها حقًا هنا وأنا أحب ذلك .
أنا واثق من أن العديد من الشركات الأخرى ستستفيد من القدرة على تطبيق الوكلاء على منتدياتها أيضًا. نماذج اللغة الكبيرة مثيرة للإعجاب للغاية، ومع ذلك ندرك أن عناصر الذكاء الاصطناعي الرمزي (المنطق/القائم على القواعد) لا تزال قابلة للتطبيق ضمن أنظمة الذكاء الاصطناعي الأكبر - مثل البنى المعرفية المبنية للتحسين نحو حالة هدف معينة.
أود أن أسمع أي ملاحظات أو أفكار أو انتقادات لهذا الاقتراح!
أنا أقرأ وأفهم الكلمات، وهذا كل شيء - لأنني مستخدم نهائي يفتقر إلى المعرفة والفهم الأساسيين. ولست متأكدًا تمامًا مما إذا كنت تحاول بالفعل بيع مفهوم B2B أو شيء مفيد للمستخدمين في بيئة منتدى. أو كليهما، هذا وضع ممكن أيضًا.
بالتأكيد، من الجيد أن يكون لديك مجموعة كبيرة ومتنوعة من الأدوات ولا يوجد سبب يجعل الجميع يستخدمون كل أداة. من الجيد أن يكون لديك مخزون كبير بما يكفي للاختيار من بينه.
هل يمكنك تقديم أمثلة عملية لما يمكن أن يقدمه كل هذا للعمل التجاري وراء المنتدى وللمستخدم؟
يمكن للمرء أن يتخيل عددًا لا نهائيًا من حالات الاستخدام لربط نماذج اللغة الكبيرة (LLMs) معًا لتحقيق هدف ما، ولكن إليك مثال بسيط وواقعي…
لنفترض أن هناك منتدى للباحثين الذين يحتاجون إلى العثور على أوراق بحثية جديدة بسرعة وسهولة. يمكن للمرء ببساطة استخدام مكتبة http المتاحة بالفعل في أداة بناء الأدوات المخصصة لمكونات الذكاء الاصطناعي، ثم إنشاء أداة ترسل طلبًا إلى قاعدة بيانات أوراق (على سبيل المثال، arXiv أو مجلة أكاديمية محكّمة). ولكن هذا في الأساس مجرد محاولة “مرة واحدة”.
نهج أفضل سيكون ربط استدعاءات متعددة لنماذج اللغة الكبيرة لاتخاذ نهج خطوة بخطوة للمشكلة:
الدردشة مع المستخدم حول موضوع بحثه (كرر ذلك عدة مرات للحصول على الكثير من التفاصيل)
تلخيص احتياجات المستخدم وفقًا لنموذج محدد مسبقًا
تحويل هذا الملخص إلى طلب API واستلام قائمة بالنتائج المحتملة من قاعدة بيانات الأوراق
تحليل ملخص كل ورقة للتأكد من أنها ذات صلة بالفعل
تقديم هذه القائمة للمستخدم وشرح سبب أهمية كل ورقة لموضوع بحثه.
هذا ليس ما أعمل عليه (لا أرغب بالضرورة في الكشف عن نموذج عملي وهيكلي :D)، ولكنه مثال بسيط وواقعي يتم معالجته بالفعل من قبل بعض المطورين.
في الأساس، ما أحاول بيعه للمستخدمين (عبر مكون الاشتراكات الجميل) هو الوصول إلى روبوت ذكاء اصطناعي أكثر تعقيدًا من مجرد موجه نظام مع أداة بسيطة مرتبطة بخدمة ما ترسل بعض البيانات (أسعار الأسهم، إلخ). أكثر تعقيدًا بمعنى أنه يحل مشكلة / يعالج استعلام مستخدم في خطوات متعددة، كل خطوة تستخدم نموذج لغة كبير مع موجه نظام مختلف. هذا هو جوهر ما يفعله نموذج OpenAI o1 الجديد.
لقد فكرت في ذلك بالتأكيد، ولكن بصفتي باحثًا في مجال الذكاء الاصطناعي، فإن خبرتي/معرفتي البرمجية تتركز في Python والمكتبات مثل NumPy و PyTorch وما إلى ذلك . لا أعرف شيئًا عن Ruby وقليل جدًا عن JavaScript. على الرغم من أنني وقعت في حب Discourse، إلا أنني قررت أن أبدأ ببطء في تعلم هذه اللغات وكذلك تطوير إضافات Discourse. لذا إذا كان لديك أي توصيات لموارد تعليمية فسأكون ممتنًا!
o1 لطيف ومفيد، وأتوقع أن أستخدمه كثيرًا في البرمجة، ومع ذلك فإن ما أعمل عليه هو بنية معرفية، لذا فهو وضع مختلف قليلاً. أنا في عقلية “أريد بناء شيء ما بناءً على الأبحاث في علوم الإدراك الحاسوبي، وسيكون من الرائع لو كان بإمكاني بيعه” وليس حقًا “لدي فكرة ويمكنني تفويضها إلى OpenAI وجني الأموال”. آمل أن يكون هذا منطقيًا .
أوه نعم، وستكون بنيتنا المعرفية أرخص بحوالي 20 مرة من o1 .
تعلم بالممارسة، انسخ أولاً الإضافات الموجودة واختر أولاً الوظائف السهلة لجعلها عملية تكرارية أسهل. اصنع شيئًا تحتاجه حقًا، لأنك ستحتاج إلى الحافز للتغلب على الحواجز التي تواجهها.