سيكون من الرائع تقديم خيارات حول المدة التي يجب أن يكون عليها الملخص. يبدو أن هذا يستهدف عدد الكلمات 150-200 وهو ليس كثيرًا لبعض المواضيع.
أود تخصيص الموجه. على سبيل المثال، سأفترض افتراضيًا النقاط.
أود تجربة موجه يقتبس من يقول ماذا ويشير إلى المنشورات
سأفصل التلخيص باستخدام الحد الأدنى لإعدادات المنشورات للذكاء الاصطناعي عن الإعداد العام. من المحتمل أن يكون التلخيص باستخدام الذكاء الاصطناعي مفيدًا مع عدد أقل من المنشورات
لاحظ أن gpt-3.5 لديه الآن إصدار بحد أقصى 16 ألف رمز قد يكون ذا صلة كبيرة هنا.
والآن الميزتان القاتلتان اللتان أود رؤيتهما:
ملخصات يومية باستخدام ميزة التلخيص بالذكاء الاصطناعي
ملخصات عند تحريك مؤشر الفأرة فوق الموضوع (على سبيل المثال، محسوبة مسبقًا)
باستخدام Gemini 1.5 Flash، غالبًا ما تحتوي الملخصات على روابط لعدة مشاركات، ولكن الروابط المتعددة لا يتم عرضها كروابط. لا أتذكر رؤية نماذج أخرى تحاول استخدام روابط متعددة.
حسنًا، هذا ببساطة تنسيق ماركداون غير صالح ولهذا السبب لا يعمل.
من المؤسف أن Gemini Flash لا يمكنه إنتاج تنسيق ماركداون صالح، هنا في Meta نستخدم Llama 3.1 المكمم إلى FP8 للملخصات، ويمكنه التعامل مع إنتاج روابط ماركداون صحيحة بشكل جيد.
لا أعرف ما إذا كنت ستنظر في تصحيح المشكلات المعروفة، مثل التحقق من أيام الاثنين ومن علامة markdown هذه تحديدًا. أدرك أنها ليست مثالية، ولكنها قد تكون أفضل من فقدان خيارات نماذج اللغة الكبيرة الجيدة بخلاف ذلك.
هذا يبدو قابلاً للإصلاح للغاية بالنسبة لي حيث يمكننا تحسين مثالنا هنا، في الوقت الحالي يكون الموجه:
أنت روبوت تلخيص متقدم يقوم بإنشاء ملخصات موجزة ومتماسكة للنص المقدم.\n\n- قم بتضمين الملخص فقط، دون أي تعليق إضافي.\n- أنت تفهم وتنشئ تنسيق Markdown الخاص بمنتدى Discourse؛ بما في ذلك الروابط، _المائلة_، **الغامقة**.\n- حافظ على اللغة الأصلية للنص الذي يتم تلخيصه.\n- استهدف أن تكون الملخصات 400 كلمة أو أقل.\n- يتم تنسيق كل مشاركة على النحو التالي: \"<رقم المشاركة> <اسم المستخدم> <الرسالة>\"\n- قم بالاستشهاد بمشاركات محددة جديرة بالملاحظة باستخدام التنسيق [الاسم](/t/-/31793/رقم_المشاركة)\n - مثال: رابط للمشاركة الثالثة بواسطة sam: [sam](/t/-/31793/3)\n - مثال: رابط للمشاركة السادسة بواسطة jane: [agreed with](/t/-/31793/6)\n - مثال: رابط للمشاركة 13 بواسطة joe: [#13](/t/-/31793/13)\n- عند تنسيق أسماء المستخدمين، استخدم إما @اسم_المستخدم أو [اسم_المستخدم](/t/-/31793/رقم_المشاركة)
هذا يبدو غامضًا بعض الشيء. يمكننا دعمه بشيء مثل هذا:
بشكل أساسي، @Roman / @Falco، سيتعين علينا إخراج هذه الموجهات من شجرة الكود المصدري وربما وضعها في شخصية حتى تتمكن المجتمعات من تعديلها ومشاركة ما يعمل بشكل أفضل.
لن أتفاجأ إذا كان على المدى الطويل نحتاج إلى موجهات خاصة بالنماذج الأضعف.
ستعمل الشخصية بشكل رائع هنا إذا كان لدينا دعم لـ “الأمثلة” التي لا تبدو امتدادًا كبيرًا. إما أن ننقلها إلى CompletionPrompt ونمنحها واجهة مستخدم.
هذه هي الفكرة الأساسية لـ “دوال الشخصية” و “العبارات المعدة” التي كنا نناقشها هذا العام. سنقوم بنقل كل شيء مثل مساعد الذكاء الاصطناعي، والملخص، والبحث، وما إلى ذلك لاستخدامها، والسماح بإنشاء عبارات مخصصة وواجهة مستخدم لربطها بالميزات في واجهة المستخدم.
يصبح الأمر صعبًا عندما نقوم بتحديث العبارات المضمنة لشحن تنسيق مختلف، على سبيل المثال من XML إلى JSON، لذا نأمل أن يكون شيئًا يمكننا التفكير في بنائه العام المقبل.
لا أتابع المنشورات القليلة الأخيرة بالكامل. ما زلت أحصل على الملخصات غير الصالحة. هل هناك شيء محدد يمكنني تجربته مع الشخصيات، أم أحتاج إلى انتظار إعادة الهيكلة التي تناقشونها؟