ملاحظات على تلخيص الذكاء الاصطناعي

ملاحظات حول التلخيص. يبدو هذا واعدًا جدًا :pray:

:point_up: النافذة المنبثقة ليست عريضة بما فيه الكفاية

  • سيكون من الرائع تقديم خيارات حول المدة التي يجب أن يكون عليها الملخص. يبدو أن هذا يستهدف عدد الكلمات 150-200 وهو ليس كثيرًا لبعض المواضيع.
  • أود تخصيص الموجه. على سبيل المثال، سأفترض افتراضيًا النقاط.
  • أود تجربة موجه يقتبس من يقول ماذا ويشير إلى المنشورات
  • سأفصل التلخيص باستخدام الحد الأدنى لإعدادات المنشورات للذكاء الاصطناعي عن الإعداد العام. من المحتمل أن يكون التلخيص باستخدام الذكاء الاصطناعي مفيدًا مع عدد أقل من المنشورات

لاحظ أن gpt-3.5 لديه الآن إصدار بحد أقصى 16 ألف رمز قد يكون ذا صلة كبيرة هنا.

والآن الميزتان القاتلتان اللتان أود رؤيتهما:

  • ملخصات يومية باستخدام ميزة التلخيص بالذكاء الاصطناعي
  • ملخصات عند تحريك مؤشر الفأرة فوق الموضوع (على سبيل المثال، محسوبة مسبقًا)
4 إعجابات

نحن نستخدم موجهًا مبسطًا في الوقت الحالي (عند تحديد OpenAI أو Anthropic)، ولكننا سنغيره قريبًا جدًا حيث نعمل عليه حاليًا.

تخصيصه ميزة مثيرة للاهتمام، قد نضيفها في المستقبل.

لقد جعلناه يظهر للمشاركات التي تحتوي على رد واحد على الأقل هذا الأسبوع.

لقد أضفنا نماذج سياق كبيرة لـ OpenAI في اليوم الذي تم إصدارها فيه. حاليًا يمكنك الاختيار من بين:

  • GPT 3.5 Turbo مع 16 ألف
  • GPT 4 مع 32 ألف
  • Claude مع 100 ألف

هناك عمل جارٍ لتخزين الملخصات التي تم إنشاؤها مؤقتًا بحيث يمكن استخدامها في أماكن أخرى، مما يفتح ميزات مثل هذه.

7 إعجابات

لا أرى ذلك في موقعي، هل هناك إعداد يتحكم في ذلك؟

اقتراحات أخرى:

  • عرض زر التلخيص بالذكاء الاصطناعي في خط الأنابيب.
  • وجود طريقة لاستبدال التلخيص العادي بالتلخيص بالذكاء الاصطناعي.
  • السماح بتوجيه نماذج GPT إلى Azure. لقد لاحظنا تحسنًا كبيرًا في زمن الاستجابة في شركتي.
إعجابَين (2)

لقد أجرينا هذا التغيير هذا الأسبوع، لذا سيتم طرحه على موقعك خلال الأيام القليلة القادمة.

ماذا تعني “خط الأنابيب” هنا؟

كما ترى هنا في Meta، لقد فعلنا ذلك بالفعل. يُطلق على الملخص القديم الآن اسم “إظهار الردود العليا”. ما زلنا نعمل على تصميم وترتيب الأزرار.

هذا على خارطة طريقنا!

6 إعجابات

عذرًا على عدم الوضوح، ليس لدي فكرة لماذا اخترت هذه الكلمة :facepalm:

أقصد هنا

إعجاب واحد (1)

يتم ذلك لكل:

إنه مزعج للغاية في الإعداد لأنه تحتاج إلى إنشاء مجموعة من عمليات النشر، ولكنه يعمل بشكل جيد.

إعجاب واحد (1)

تم التعديل

باستخدام Gemini 1.5 Flash، غالبًا ما تحتوي الملخصات على روابط لعدة مشاركات، ولكن الروابط المتعددة لا يتم عرضها كروابط. لا أتذكر رؤية نماذج أخرى تحاول استخدام روابط متعددة.

يتم عرض الروابط للمشاركات الفردية بشكل صحيح.

تتضمن حمولة الاستجابة المقابلة هذا النص:

[تم حجب اسم المستخدم](/t/-/56915/8, /t/-/56915/13, /t/-/56915/28, /t/-/56915/33, /t/-/56915/36)

أنا حقًا أحب فكرة الاستشهاد بروابط متعددة، إذا كان يمكن عرضها بشكل صحيح.

حسنًا، هذا ببساطة تنسيق ماركداون غير صالح ولهذا السبب لا يعمل.

من المؤسف أن Gemini Flash لا يمكنه إنتاج تنسيق ماركداون صالح، هنا في Meta نستخدم Llama 3.1 المكمم إلى FP8 للملخصات، ويمكنه التعامل مع إنتاج روابط ماركداون صحيحة بشكل جيد.

إعجابَين (2)

وهذا haiku لا يمكنه على ما يبدو إرجاع رمز حالة صالح. هذان هما الاثنان اللذان جربتهما للتلخيص حتى الآن. سأجرب Llama 3.1 تاليًا.

لا أعرف ما إذا كنت ستنظر في تصحيح المشكلات المعروفة، مثل التحقق من أيام الاثنين ومن علامة markdown هذه تحديدًا. أدرك أنها ليست مثالية، ولكنها قد تكون أفضل من فقدان خيارات نماذج اللغة الكبيرة الجيدة بخلاف ذلك.

هل يمكنك رؤية ملخصات غير صالحة على https://discuss.ai.google.dev/؟

نحن نستخدم فلاش هناك ، إذا كان بإمكانك ربطي ببعضها ، فسأكون سعيدًا بالقيام ببعض هندسة المطالبات.

هذا هو الوحيد الذي أراه حاليًا، ولكن هذه المواضيع قصيرة، لذلك لا يُستشهد عادةً بنفس المستخدم عدة مرات.

إعجاب واحد (1)

هذا يبدو قابلاً للإصلاح للغاية بالنسبة لي حيث يمكننا تحسين مثالنا هنا، في الوقت الحالي يكون الموجه:

أنت روبوت تلخيص متقدم يقوم بإنشاء ملخصات موجزة ومتماسكة للنص المقدم.\n\n- قم بتضمين الملخص فقط، دون أي تعليق إضافي.\n- أنت تفهم وتنشئ تنسيق Markdown الخاص بمنتدى Discourse؛ بما في ذلك الروابط، _المائلة_، **الغامقة**.\n- حافظ على اللغة الأصلية للنص الذي يتم تلخيصه.\n- استهدف أن تكون الملخصات 400 كلمة أو أقل.\n- يتم تنسيق كل مشاركة على النحو التالي: \"<رقم المشاركة> <اسم المستخدم> <الرسالة>\"\n- قم بالاستشهاد بمشاركات محددة جديرة بالملاحظة باستخدام التنسيق [الاسم](/t/-/31793/رقم_المشاركة)\n - مثال: رابط للمشاركة الثالثة بواسطة sam: [sam](/t/-/31793/3)\n - مثال: رابط للمشاركة السادسة بواسطة jane: [agreed with](/t/-/31793/6)\n - مثال: رابط للمشاركة 13 بواسطة joe: [#13](/t/-/31793/13)\n- عند تنسيق أسماء المستخدمين، استخدم إما @اسم_المستخدم أو [اسم_المستخدم](/t/-/31793/رقم_المشاركة)

هذا يبدو غامضًا بعض الشيء. يمكننا دعمه بشيء مثل هذا:

بشكل أساسي، @Roman / @Falco، سيتعين علينا إخراج هذه الموجهات من شجرة الكود المصدري وربما وضعها في شخصية حتى تتمكن المجتمعات من تعديلها ومشاركة ما يعمل بشكل أفضل.

لن أتفاجأ إذا كان على المدى الطويل نحتاج إلى موجهات خاصة بالنماذج الأضعف.

ستعمل الشخصية بشكل رائع هنا إذا كان لدينا دعم لـ “الأمثلة” التي لا تبدو امتدادًا كبيرًا. إما أن ننقلها إلى CompletionPrompt ونمنحها واجهة مستخدم.

5 إعجابات

أنا أحب فكرة تخصيص الموجه لتلبية احتياجاتك والاستفادة من قدرات النموذج. أعتقد أيضًا أن تحويل الشخصيات إلى مفهوم أكثر تجريدًا من الميزات هو فكرة جيدة.

إعجاب واحد (1)

هذه هي الفكرة الأساسية لـ “دوال الشخصية” و “العبارات المعدة” التي كنا نناقشها هذا العام. سنقوم بنقل كل شيء مثل مساعد الذكاء الاصطناعي، والملخص، والبحث، وما إلى ذلك لاستخدامها، والسماح بإنشاء عبارات مخصصة وواجهة مستخدم لربطها بالميزات في واجهة المستخدم.

يصبح الأمر صعبًا عندما نقوم بتحديث العبارات المضمنة لشحن تنسيق مختلف، على سبيل المثال من XML إلى JSON، لذا نأمل أن يكون شيئًا يمكننا التفكير في بنائه العام المقبل.

إعجاب واحد (1)

لا أتابع المنشورات القليلة الأخيرة بالكامل. ما زلت أحصل على الملخصات غير الصالحة. هل هناك شيء محدد يمكنني تجربته مع الشخصيات، أم أحتاج إلى انتظار إعادة الهيكلة التي تناقشونها؟

تم تقسيم 4 مشاركات إلى موضوع جديد: التعامل مع مشكلات تنسيق استجابة JSON الخاصة بـ DeepSeek