ارتفاع استخدام المعالج (Ruby)

AstonJ · 25 يناير 2025، 1:50ص

أرى بشكل متكرر استخدامًا عاليًا لوحدة المعالجة المركزية (CPU) وعادة ما يكون حول علامة 85٪:

كان يظهر سابقًا باسم unicorn.conf.r:

هل يمكن أن يشير هذا إلى أن UNICORN_WORKERS تم تعيينه على قيمة عالية جدًا/منخفضة جدًا؟
يحتوي الخادم على 64 جيجابايت من ذاكرة الوصول العشوائي (RAM) (عادة ما تظهر حوالي 40 جيجابايت مجانية) و 6 أنوية، وهناك 4 مثيلات من Discourse على الخادم، تم تعيين كل منها على UNICORN_WORKERS: 8

هل لديك أي أفكار أو نصائح حول سبب ذلك أو ما يجب تجربته؟ (أحد المنتديات في وضع القراءة فقط ولا يحصل على الكثير من الزيارات، هل يجب تعيينه ليكون لديه عدد أقل من العمال؟)

Jagster · 25 يناير 2025، 9:16ص

لا أعرف، لكن رهاني هو أنك تستخدم عددًا أكبر بكثير من العمال مما يمكن أن تقدمه أنويتك؟

NateDhaliwal · 25 يناير 2025، 9:22ص

نعم. أقترح أيضًا تقليل عدد عمال وحيد القرن:

pfaffman · 25 يناير 2025، 10:25ص

يمكنك محاولة تقليل عدد عمال يونيكورن.

AstonJ · 26 يناير 2025، 12:25ص

شكراً لجميع الردود - لست متأكداً من أين قرأتها الآن ولكنني كنت أعتقد دائماً أنه يجب علينا تعيين عاملين لكل نواة. لقد قللت الآن عدد العمال لكل منتدى، مع تخصيص المزيد للمنتديات الأكثر ازدحاماً وأقل للمنتديات الأقل ازدحاماً. سأراقب الأمور خلال الأسبوع المقبل وسأبلغ عن ذلك إذا لم يساعد ذلك.

تعديل: أعتقد أنني قرأتها هنا.

Stephen · 28 يناير 2025، 5:52م

في حالتك، أنت لا تخصص عاملين لكل نواة. لديك ست نوى مما يعني اثني عشر عاملاً، ولكن لديك أربع مثيلات يستخدم كل منها ثمانية عمال، أي 32 في المجموع.

AstonJ · 28 يناير 2025، 5:58م

نعم… لقد قمت بالتعديل بحيث لا يتجاوز العدد الإجمالي للعاملين ضعف عدد الأنوية، على الرغم من أنني ما زلت أتساءل - ما هي النصيحة الصحيحة/المعيارية، ما قلته أنت أم ما كان في منشور نيت، حيث يقتبس جيف قائلاً عامل واحد لكل نواة؟

من تجاربي الخاصة، يؤدي عامل واحد لكل نواة إلى انتهاء المهلة (ولكنه يقلل من حمل الخادم) والمزيد من العمال يؤدي إلى أداء أفضل ولكن حمل أعلى (والذي لا يزال ضمن نطاق مقبول على خادمي).

Stephen · 28 يناير 2025، 9:57م

إلق نظرة على discourse-setup، الذي يتعامل مع التوسع للتثبيتات الجديدة اليوم:

# UNICORN_WORKERS: 2 * GB for 2GB or less, or 2 * CPU, max 8
  if [ "$avail_gb" -le "2" ]
  then
    unicorn_workers=$(( 2 * $avail_gb ))
  else
    unicorn_workers=$(( 2 * $avail_cores ))
  fi
  unicorn_workers=$(( unicorn_workers < 8 ? unicorn_workers : 8 ))

هذه العبارة الثانية، التي تستخدم ضعف عدد الأنوية المتاحة، هي الافتراضية في الأنظمة التي تحتوي على أكثر من 2 جيجابايت من ذاكرة الوصول العشوائي. يبدو أن مشكلتك تتعلق أكثر بالصراع بين مثيلاتك (موارد المضيف)، بدلاً من مشكلة discourse.

markschmucker · 29 يناير 2025، 4:31م

أرى نفس الشيء بعد آخر ترقية لي، والتي كانت بعد يوم واحد من المنشور الأصلي، لذلك لا أعتقد أن هذا له علاقة بعدد عمال يونيكورن. عملية unicorn.conf.r* تثير الشبهات، لأن المنشور الأصلي لهذا الموضوع هو النتيجة الوحيدة لهذا المصطلح على شبكة الإنترنت بأكملها. أعتقد أن unicorn.conf.rb سيكون أكثر طبيعية.

حدثت الزيادة بالضبط في آخر ترقية لي، قبل 4 أيام. لاحظ أن المنشور الأصلي نُشر قبل 5 أيام. لقد تغير شيء ما في Discourse.

لقد استخدمت نفس عدد عمال يونيكورن على نفس المثيل لعدة سنوات، ولم أغير أي شيء - فقط أعدت البناء إلى 3.4.0.beta4-dev.

markschmucker · 29 يناير 2025، 9:09م

على أي حال، لا توجد مهام طويلة الأمد أو فاشلة في sidekiq.

markschmucker · 30 يناير 2025، 1:30م

لقد أعدت البناء بدون أي إضافات (باستثناء مدير docker) واستمرت المشكلة، لذا فهي ليست خطأ أي إضافة.

هل هناك أي أدلة هنا؟

AstonJ · 30 يناير 2025، 5:34م

لقد قمت للتو بالترقية إلى أحدث إصدار من Discourse ولم أعد أرى unicorn.conf.r* (الآن أي شيء حول علامة 80% من وحدة المعالجة المركزية هو مجرد ruby، على الرغم من أنه يبدو أقل تكرارًا). الأحمال متساوية تقريبًا (على الرغم من أنها أقل مما كانت عليه بعد إجراء تعديلات العامل).

هل قمت بالترقية إلى أحدث إصدار؟ ما نوع الأجهزة التي تستخدمها ومدى انشغال منتداك؟

markschmucker · 30 يناير 2025، 5:47م

نعم، أنا على الإصدار 3.4.0.beta4-dev. هذا هو ما بدأ استخدام وحدة المعالجة المركزية المرتفع. لم يتغير شيء آخر.

8 جيجابايت من ذاكرة الوصول العشوائي، 2 وحدة معالجة مركزية افتراضية، 160 جيجابايت SSD مع مساحة كافية.

لقد نشرت استخدام وحدة المعالجة المركزية أعلاه لموقع الإنتاج الخاص بي، والذي يحتوي على حوالي 30 مستخدمًا متصلين في وقت واحد. ولكن لدي موقع اختبار به نفس المشكلة ولا توجد حركة مرور ولا إضافات هناك. استخدام وحدة المعالجة المركزية قبل وبعد التحديث (الارتفاعات هي النسخ الاحتياطي اليومي):

AstonJ · 31 يناير 2025، 9:24ص

لست متأكدًا مما إذا كانت مواقفنا مرتبطة يا مارك. أعتقد في حالتي أن ما قاله ستيفن لعب دورًا كبيرًا:

لقد نقلت مؤخرًا مثيلين آخرين إلى نفس الخادم ونسيت بالفعل أن عمال يونيكورن تم ضبطهم على 8 لأننا كنا سابقًا على خادم به نوى أكثر (لكنه كان به مشاكله الخاصة، ولهذا عدنا إلى Xeon الذي كان به نوى أقل ولكنه كان يعمل بشكل أفضل بشكل عام).

لذا، ما وجدته هو أن تقليل عمال يونيكورن على هذا الخادم قلل الحمل، ولكنه بدأ يعطينا مهلات زمنية، وزيادتها قضت على المهلات الزمنية ولكنها أدت إلى حمل أعلى - على الرغم من أنه لا يزال ضمن نطاق مقبول. أعتقد أنه يمكنني زيادة العمال ويمكننا التعامل مع الحمل المتزايد، ولكن ما لدينا الآن جيد في الوقت الحالي.

مع ذلك، لقد نقلت المثيلات إلى نفس الخادم وكان يعمل ضمن ما كنت أتوقعه (لذا زاد الحمل ولكن ليس بشكل كبير) وشعرت بالفعل أن التحديث أدى إلى أحمال أعلى… ومع ذلك لا يمكنني التأكد من ذلك، وعلينا أن نأخذ في الاعتبار أنه من وقت لآخر مع حصول Discourse على المزيد من الميزات قد يتطلب أجهزة أقوى أو يؤدي إلى الشعور أحيانًا بأنه “أبطأ” (كان لدي بعض مثيلات Discourse على إصدارات قديمة وشعرت بأنها أسرع بشكل ملحوظ - على الرغم من أنها بالطبع لم تكن بها جميع ميزات الإصدارات الأحدث).

مع ذلك أيضًا، أعتقد أن الأحمال قد انخفضت قليلاً منذ آخر تحديث لـ Discourse (مع PG 15).

لست متأكدًا مما أقترحه لك يا مارك - ربما تلعب بإعدادات العمال وبعض الإعدادات الأخرى أيضًا؟ مثل db_shared_buffers و db_work_mem؟ ربما تبدأ موضوعًا مخصصًا على غرار “استخدام وحدة المعالجة المركزية مرتفع بعد التحديث - هل يحتاج مثيلي إلى تعديلات في الأداء؟” أو شيء من هذا القبيل

LotusJeff · 1 فبراير 2025، 4:17ص

لقد قمت بالترقية الليلة وشاهدت على الفور اختلافًا في استخدام وحدة المعالجة المركزية على موقعي. إليك رسم بياني لما قبل الترقية وأثناءها وبعدها. يمثل هذا مدة ساعة واحدة.

تثبيت قياسي لـ Discourse في حاوية واحدة يعمل على DO - ذاكرة وصول عشوائي 8 جيجابايت، 2 وحدة معالجة مركزية افتراضية، و 100 جيجابايت SSD مع مساحة وفيرة.

سنرى كيف سيبدو بعد 12 ساعة.

LotusJeff · 1 فبراير 2025، 7:18م

هذه هي النتائج بعد 15 ساعة من الترقية. زاد استخدام وحدة المعالجة المركزية بنسبة 3 أضعاف. زاد عامل التحميل بمقدار 4 أضعاف.

دقيقة متوسطة	قبل الترقية	بعد الترقية
5	.11	.4
15	.10	.45

عرض 24 ساعة:

جافا هي الاستخدام الرئيسي لوحدة المعالجة المركزية. لقد تغير شيء ما بشكل كبير في أحدث ترقية.

ما هي المعلومات التي يحتاجها فريق Discourse لاستكشاف الأخطاء وإصلاحها؟
هل يجب نقل هذا الموضوع إلى قسم الأخطاء؟

AstonJ · 3 فبراير 2025، 11:28ص

إذًا، يبدو أن مشكلتي لم تكن في عمال unicorn بعد كل شيء - بعد تحديث @sam الذي تلى الموضوع الخاص بـ @LotusJeff، عادت أحمال الخادم إلى ما كانت عليه (أقل من نصف ما ارتفعت إليه)…

markschmucker · 3 فبراير 2025، 2:02م

لقد أدى هذا أيضًا إلى حل مشكلتي.

AstonJ · 3 فبراير 2025، 2:22م

ربما لم أكن لألاحظ لو لم أكن أراقب الخادم بعد أن قمت مؤخرًا بنقل المنتديين الآخرين عليه - أتساءل كم عدد الأشخاص الذين تأثروا دون أن يدركوا ذلك؟

هل لدى فريق Discourse إجراءات معمول بها لتنبيههم بالمشكلات مثل هذه؟ ربما برنامج تطوعي يمكن للمسؤولين إعداده لمواضيع محددة، على سبيل المثال، “إرسال أحمال الخادم إلى Discourse في غضون XX ساعات/أيام/أسابيع قبل/بعد الترقية” أو الأفضل من ذلك تتبع هذه محليًا ثم تنبيه المسؤولين عند ملاحظة زيادة أحمال الخادم بعد الترقيات - والتي يمكننا بعد ذلك نشرها هنا إذا لزم الأمر.

LotusJeff · 3 فبراير 2025، 3:46م

ربما لم أكن لألاحظ التأثير، لكنني أراقب الخادم عن كثب لأننا انتقلنا إلى Discourse قبل حوالي أسبوعين. أنا منغمس في التحقق من صحة ما بعد الترحيل (تشغيل النسخ الاحتياطي، وما إلى ذلك). بعد بضعة أشهر، لن ألاحظ التأثير أبدًا.

آمل أن يكون لدى Discourse اختبار تحميل يومي. في حياتي السابقة، كان لدي خادم يعاد بناؤه يوميًا مع الرموز الملتزم بها. كان لديه مستخدمون محاكون يستخدمون الخادم طوال اليوم. قسنا مقاييس الأداء الرئيسية من منظور المستخدم ومن منظور الخادم. سمح لنا ذلك بالتقاط تسرب الذاكرة، والرموز غير الفعالة، والتغييرات غير المتوقعة في تجربة المستخدم بشكل استباقي.

لا يزال يتعين علي تقديم الشكر لسام والفريق. بالانتقال من عالم phpBB، حيث سيستغرق حل شيء كهذا وإصلاحه عقودًا، وجدت الاستجابة السريعة رائعة. (حتى لو كان ذلك يعني البقاء مستيقظًا حتى الساعة 2 صباحًا بتوقيت CT مقارنة بتوقيت سيدني.)

الموضوع		الردود	مرات العرض
Recommendation for number of workers: cores × 2? Self-hosting	16	466	29 أبريل 2025
Due to extreme load, this is temporarily being shown to everyone... when it's not really the case Self-hosting server-resources	19	1820	21 يوليو 2023
Optimizing the number of Unicorns and buffer size Self-hosting server-resources	22	6940	9 يونيو 2018
Browser upgrade fails when discourse is configured to use one unicorn worker Bug	5	465	18 أكتوبر 2023
How to avoid upstream timeouts? Support	24	9493	25 فبراير 2019

ارتفاع استخدام المعالج (Ruby)

الموضوعات ذات الصلة