كيف تعمل عملية تجديد الملخصات؟

هل يمكن لأحد أن يشرح قواعد إعادة إنشاء الملخصات؟ كان هناك بعض النقاش حول إمكانية قيام الموظفين بإعادة إنشاء الملخصات بعد ساعة، ولكن هذا ليس ما أراه. (لست متأكدًا مما أراه - يبدو غير متسق.) إذا كان هناك منشور جديد، فهل يجب أن يقدم خيار إعادة الإنشاء؟ ولمن، للموظفين فقط أم للجميع؟

بعد التجربة، إليك ما أراه:

  • بالنسبة للمواضيع التي تحتوي على أقل من 100 مشاركة، يكون زر إعادة الإنشاء ممكّنًا على الفور للموظفين فقط
  • بالنسبة للمواضيع التي تحتوي على أكثر من 100 مشاركة، لا يتم تمكين زر إعادة الإنشاء، حتى بعد الانتظار لمدة ساعة

حتى لو تم تمكين زر إعادة الإنشاء، فإنه ليس مسار عمل قابلاً للتطبيق لموظفينا لمواصلة الضغط على الأزرار، لذلك أخطط مبدئيًا لتنفيذ خطاف ويب يستمع للمشاركات الجديدة التي تعيد إنشاء الملخص باستخدام https://forum.example.com/discourse-ai/summarization/t/12345. تشير الحسابات السريعة إلى أن ذلك سيكلف حوالي 500 دولار سنويًا لمنتدانا. أدرك أن Discourse تحاول الحماية من تكلفة كبيرة غير متوقعة.

مرحباً @markschmucker،

نحن نعمل حاليًا على استراتيجية إعادة تعبئة لملخصات المواضيع في DiscourseAI. نخطط لإطلاقها الأسبوع المقبل، وسأقوم بتحديثك هنا عند وصولها.

4 إعجابات

لدينا الميزة الآن يا @markschmucker، يمكنك ضبطها عبر إعداد الموقع ai summary backfill maximum topics per hour.

لقد قمت بتعيين ذلك على 12، وفي لوحة معلومات Anthropic الخاصة بي أرى حدثًا كل 5 دقائق، كما هو متوقع. لكنني لا أرى الحمولة من تلك اللوحة. كيف يمكنني رؤية الملخص الذي يعيد Discourse إنشاؤه؟

يتم تخزين كل شيء في جدول ai_api_audit_logs. إذا كان لديك Data Explorer، يمكنك استخدام الاستعلام التالي:

SELECT
  *
FROM
  ai_api_audit_logs
ORDER BY
  id DESC
LIMIT
  100

بعد اللعب بهذا، يبدو أن الملء الخلفي ينشئ ملخصات لبعض أحدث المواضيع (يبدو أنها حوالي 100 موضوع أو مواضيع تم تحديثها في الأسابيع القليلة الماضية؟).

أثناء أو بعد دورة الملء الخلفي، إذا حصل موضوع لديه ملخص على منشور جديد، فلن يتم تحديث ملخصه تلقائيًا. (إذا كان لديه أقل من 100 منشور، فهناك زر “إعادة إنشاء” يمكن للموظفين الضغط عليه يدويًا.)

متى يجب تحديث الموضوع بمنشور جديد؟

يجب تحديثه في غضون 5 دقائق بعد نشر رد، على الأقل للمواضيع العادية التي تحتوي على أقل من 50 ردًا.

هل مجتمعك موجه أكثر نحو المواضيع الضخمة؟

مرحباً @Roman

الآن أرى أنه كان هناك فشل في مهمة SummariesBackfill - لقد وصلت إلى حد المعدل اليومي في Anthropic. قد يكون هذا هو سبب توقفها بعد ربما آخر 100 موضوع، وسبب عدم حصول الموضوع المحدث على ملخص جديد.

إذًا، إذا لم أصل إلى حد المعدل، هل ستقوم SummariesBackfill بتلخيص جميع مواضيعنا البالغ عددها 60 ألفًا؟ حتى تلك التي كانت غير نشطة لسنوات؟

معظم المواضيع تحتوي على أكثر من 100 رد. لدينا 8 مواضيع تحتوي على أكثر من 1000 رد.

نعم، يبدأ كل 5 دقائق لعمل دفعة، مع إعطاء الأولوية للأكثر نشاطًا وحداثة وتخطي تلك التي لديها بالفعل ملخص محدث.

إذا قمت بتكوين الحد الأقصى للساعة ليكون أعلى من عدد المواضيع ذات النشاط الجديد لديك في الساعة، في المتوسط، فسوف يقوم في النهاية بعمل نسخة احتياطية لجميع مواضيعك.

إعجابَين (2)

طلب ميزة: شيء مثل ai summary backfill maximum age، حتى لا نتحمل تكلفة كبيرة في تلخيص الموضوعات القديمة التي لم يطرأ عليها نشاط خلال الأشهر الستة الماضية. أقدر أن الأمر سيكلفنا 3000 دولار لتلخيص الـ 60000 كلها، والتي لا نهتم بمعظمها.

نسخ @Roman

فقط للتأكيد، هل تستخدم haiku 3.5، يجب أن ينتج ملخصات جيدة

أنا أستخدم Sonnet 3.5، لسبب وجيه. يجب أن يخفض Haiku 3.5 التكلفة كثيرًا. أعتقد أن طلب الميزة لا يزال يستحق النظر فيه.

إعجاب واحد (1)

بالتأكيد.
أعتقد أنه يمكننا إنشاء خوارزمية ملء خلفي رائعة في الأتمتة، حيث توجد العديد من الإعدادات التي قد ترغب في تعديلها بخلاف العمر.

  • هذه الفئات فقط
  • محتوى بأكثر من X مشاهدة
  • محتوى بأكثر من N إعجاب
  • محتوى بإجابات مقبولة
  • محتوى أحدث من X

إضافة 10 إعدادات للموقع لهذا ستُربك المستخدمين.

إعجابَين (2)

أوافق مارك. إذا كنا سنطبق هذا على منتدانا، فإننا لا نريد تلخيص المشاركات القديمة التي لا يوجد بها نشاط جديد. الذكاء الاصطناعي مكلف للغاية في الوقت الحالي بالنظر إلى أن الملخصات هي مجرد جزء صغير من جميع أدوات الذكاء الاصطناعي.

إعجاب واحد (1)

يوجد الآن ai summary backfill topic max age days، وهو افتراضيًا 30 يومًا.

لا يتم “إعادة تلخيص” المواضيع القديمة إلا إذا كان هناك نشاط جديد.

3 إعجابات

لقد قمت بمسح جميع الملخصات باستخدام AiSummaries.destroy_all في rails c، وبدأت تشغيلًا جديدًا باستخدام LLM مختلف، باستخدام ai summary backfill topic max age days = 60. في البداية، قمت بتعيين ai summary backfill maximum topics per hour مرتفعًا جدًا، لذلك فشلت العديد من أحدث المواضيع بسبب حدود المعدل. هذا خطئي، لكنني توقعت أنه بعد إعادة الملء لمدة 60 يومًا، سيبدأ حلقة جديدة ويعيد ملء المواضيع الفاشلة. ومع ذلك، فإنه لا يفعل ذلك - فقد أعاد الملء لمدة 60 يومًا ثم توقف.

تعمل المهمة بنجاح كل 5 دقائق، ولكنها تستغرق أجزاء من الثانية فقط، لذلك من الواضح أنها لا تجد شيئًا لإعادة ملئه.

أنا أراقب التقدم (أو عدمه) باستخدام Data Explorer، باستخدام جدولي ai_summaries و ai_api_audit_logs.

إذا قمت بالنقر يدويًا فوق زر الملخص في موضوع لم يتم إعادة ملئه، فإنه ينشئ ملخصًا جديدًا، لذا فأنا متصل بشكل صحيح بمزود الذكاء الاصطناعي، والمواضيع “قابلة للتلخيص”.

لا توجد أخطاء في /logs.

أفكار؟

تم العثور على المشكلة. إنها تقارن ai summary backfill topic max age days بـ topic.created_at، وليس updated_at. أعتقد أنه يجب تغيير هذا إلى updated_at - لدي العديد من المواضيع النشطة جدًا التي تم إنشاؤها قبل عامين والتي لا تزال تتلقى منشورات جديدة كل أسبوع، ولكن إذا استخدمت حدًا أقصى للعمر يبلغ 90 يومًا أو حتى عامًا، فلن يتم تلخيص تلك المواضيع.

يرجى النظر في تغيير هذا.

.where("topics.created_at > current_timestamp - INTERVAL '#{max_age_days.to_i} DAY'")

هل يمكننا تحديث هذه الملخصات إذا تم تحديث موضوع ما، مع العلم أن لدي العديد من مواضيع النشر الفردي التي يتم تحريرها كثيرًا (المستندات)؟

اقترح تغيير الفاصل الزمني لوظيفة الملء الاحتياطي من 5 دقائق إلى دقيقة واحدة إن أمكن. معظم (?) مزودي الذكاء الاصطناعي لديهم حدود للمعدل في الدقيقة، لذلك إذا تم تشغيل الوظيفة كل دقيقة، يمكنك إنجاز 5 أضعاف الملخصات دون تجاوز حدود المعدل لكل دقيقة.