لغز نقاش آخر

fuse · 13 أكتوبر 2022، 1:50ص

أتلقى تنبيهًا من AWS CloudWatch في الساعة 9:09 مساءً بالتوقيت الشرقي، بالإضافة إلى بعض الأصدقاء الذين أرسلوا لي رسالة نصية “يا رفاق، هل تعطل ديسكورس؟”

لا يمكنني الاتصال بمثيل AWS Lightsail عبر SSH، وجميع المقاييس معلقة/لا يتم الإبلاغ عنها.

في النهاية، أستسلم وأوقف/أعيد تشغيل مثيل Lightsail.
تم استعادة الخدمة.

أفحص السجلات بعد استعادة الخدمة، بحثًا عن معلومات.

أقوم بتشغيل Discourse كمثيل واحد، لذا فإن الخطأ في الساعة 9:05 بشأن اتصال شبكة Redis يحيرني.

لا يمكنني فرز ما حدث بخلاف “شيء ما” تعطل/فشل لـ “سبب ما”.

أي شخص يمكنه الشرح أو ترك بعض الأدلة محل تقدير.

شكرا لك!

MarcP · 13 أكتوبر 2022، 2:08ص

ما هي مواصفات الخادم؟ يبدو أنه ينفد من الموارد؟ على الأرجح وحدة المعالجة المركزية. ربما هناك مهمة يومية تعمل في ذلك الوقت؟

fuse · 13 أكتوبر 2022، 2:18ص

إنها نسخة Lightsail تحتوي على 1 وحدة معالجة مركزية، و1 جيجابايت من ذاكرة الوصول العشوائي، و40 جيجابايت من مساحة تخزين SSD.\n\nيتم استهلاك حوالي 60% من مساحة التخزين، وعندما أقوم بعمليات تنظيف تنخفض بشكل كبير.\n\nتُظهر AWS أنني نفدت أرصدة وحدة المعالجة المركزية القابلة للزيادة، وهذا غريب فقط لأن المقاييس الأخرى لا تدعم ذلك.\n\nإنها مجتمعات صغيرة جدًا (20-30 مشاركًا نشطًا) لذلك سأكون متفاجئًا إذا كان هناك قيد حقيقي على وحدة المعالجة المركزية أو ذاكرة الوصول العشوائي.\n\nلا توجد مهمة يومية على حد علمي بخلاف أي شيء قد يجدوله Discourse افتراضيًا.

Stephen · 13 أكتوبر 2022، 2:33ص

1 جيجابايت مع مساحة مبادلة هو الحد الأدنى المطلق لتشغيل ديسكورس.

منذ متى وهذه النسخة قيد التشغيل؟ ما هو حجم قاعدة البيانات؟

fuse · 13 أكتوبر 2022، 10:47ص

سأتحقق من حجم قاعدة البيانات، لا أتوقع أن يكون كبيرًا (النسخ الاحتياطي كلها حوالي 57 ميجابايت).

وقت تشغيل المثيل ليس عشر ساعات بالضبط الآن منذ أن استلزم الاسترداد إيقاف الخادم الافتراضي وإعادة تشغيله - لم أتمكن من الحصول على اتصال شل أو وحدة تحكم.

كان يعمل بشكل جيد على هذا النوع من المثيلات منذ أن قمت ببنائه (تخمين فبراير 2021).

Falco · 13 أكتوبر 2022، 1:59م

يبدو هذا مشابهًا لما يحدث عندما تقوم AWS بنقل جهازك الافتراضي من مضيف إلى آخر وتتركه في حالة غريبة بسبب ذلك. عادةً ما يحل إعادة التشغيل المشكلة.

fuse · 13 أكتوبر 2022، 4:29م

إجمالي حجم قاعدة البيانات هو 423 ميجابايت.

أكبر الجداول هي
Posts 66 ميجابايت
Post_timings 60 ميجابايت

fuse · 16 أكتوبر 2022، 4:40م

حدث فشل ثانٍ مشابه “لتحميل عالٍ”.

سأفترض تضارب الموارد.

هل حاول أي شخص استخدام لقطة Lightsail لأخذ لقطة من المثيل، واستعادتها إلى مثيل أكبر كوسيلة للترقية؟

darkpixlz · 16 أكتوبر 2022، 5:06م

يمكنك محاولة إعادة تشغيل مثيل AWS، فقد يؤدي ذلك إلى حل العديد من المشكلات.

fuse · 16 أكتوبر 2022، 5:10م

لقد انتقلت باستخدام لقطة Lightsail من وحدة معالجة مركزية واحدة وذاكرة وصول عشوائي بسعة 1 جيجابايت و SSD بسعة 40 جيجابايت إلى وحدة معالجة مركزية مزدوجة وذاكرة وصول عشوائي بسعة 4 جيجابايت و SSD بسعة 80 جيجابايت.

بخلاف الاضطرار إلى فصل عنوان IP العام وإعادة إرفاقه، والذي كان مباشرًا بما فيه الكفاية، فإن مخاوفي المتبقية هي “ما الذي فاتني”؟

هل هناك أي شيء (نسخ احتياطي، بريد إلكتروني، تكوين S3 bucket، إلخ) يجب علي التحقق منه أو هل أحتاج إلى إعادة تشغيل أي معلمات تثبيت أولية للاستفادة من الموارد التي تمت ترقيتها؟

fuse · 16 أكتوبر 2022، 6:49م

أفكر بناءً على هذا الرابط في زيادة db_shared_buffer إلى 1 جيجابايت على الأقل.
يقول ملف app.yml الحالي 128 ميجابايت، ويشير أيضًا إلى الضبط التلقائي عند بدء التشغيل.

Stephen · 16 أكتوبر 2022، 7:01م

1 جيجابايت مناسب لنظام 4 جيجابايت. تأكد أيضًا من تحديث unicorn_workers إلى 4.

التوصية المعتادة إذا كنت تنتقل بين الخوادم ستكون إعادة تشغيل discourse-setup والتي ستتولى ما سبق تلقائيًا.

github.com/discourse/discourse_docker

discourse-setup

master


      
          }
          
          
          ##
          ## If we have lots of RAM or lots of CPUs, bump up the defaults to scale better
          ##
          scale_ram_and_cpu() {
          
            local changelog=/tmp/changelog.$PPID
            # grab info about total system ram and physical (NOT LOGICAL!) CPU cores
            avail_gb=0
            avail_cores=0
            os_type=$(check_OS)
            if [ "$os_type" == "Darwin" ]; then
              avail_gb=$(check_osx_memory)
              avail_cores=`sysctl hw.ncpu | awk '/hw.ncpu:/ {print $2}'`
            else
              avail_gb=$(check_linux_memory)
              avail_cores=`lscpu --parse=core | egrep -v ^# | sort -u | wc -l`
            fi
            echo "Found ${avail_gb}GB of memory and $avail_cores physical CPU cores"

fuse · 16 أكتوبر 2022، 8:36م

شكرا. أنا الآن أتعمق في موضوع بروميثيوس.
أشياء جيدة.

الموضوع		الردود	مرات العرض
Problem installing Discourse on AWS EC2 instance Self-hosting server-resources	3	524	21 نوفمبر 2023
Connection timed out while connecting to upstream on AWS Self-hosting hosting	12	3908	28 يونيو 2016
Suddenly my server got crashed out of nowhere Self-hosting	8	485	15 مايو 2023
Discourse unavailable with high load average Support	19	2555	5 سبتمبر 2018
Due to extreme load, this is temporarily being shown to everyone... when it's not really the case Self-hosting server-resources	19	1821	21 يوليو 2023

لغز نقاش آخر

الموضوعات ذات الصلة