قد أرغب - وسأرغب - في الخدمة ولكنها لا تزال في مراحلها الأولى بالنسبة للمنتدى الذي أفكر فيه، لذا لا توجد بيانات كافية للتعامل معها بعد.
بما أنك تلعب بهذه التقنية، هل يمكنك أن تخبرنا ما هو الدور الذي تلعبه العلامات في تدريب الذكاء الاصطناعي؟ لقد بذلت الكثير من الجهد في تجميع مجموعة نصوص أحد منتدياتي لتوليد تسميات يمكن استخدامها بعد ذلك لتصنيف المواضيع ووضع علامات عليها. بينما سار التصنيف بشكل جيد للغاية، فإن تطبيق العلامات يمثل مشكلة بسبب العدد الهائل من المصطلحات المعنية. لا توجد طريقة عملية لتقديمها كلها.
أعتقد أن الذكاء الاصطناعي يمكنه استخدام هذه المصطلحات لتحسين نتائجه الخاصة.
سيقوم Discourse AI الآن بتخزين التضمينات في نفس مثيل قاعدة البيانات الذي نستخدمه لكل شيء آخر. هذا يجعل التثبيت والصيانة أسهل بكثير، وسنقوم تلقائيًا باستيراد التضمينات من قاعدة البيانات القديمة عند التحديث. بعد ذلك، يمكنك الآن إلغاء تشغيل قاعدة البيانات القديمة.
أوه، هذا يفسر المشاكل التي أواجهها الآن مع إعداداتي:
I, [2023-07-18T09:29:11.218667 #1] INFO -- : > cd /var/www/discourse & su discourse -c 'bundle exec rake db:migrate'
------------------------------خطأ Discourse AI----------------------------------
يتطلب Discourse AI امتداد pgvector على قاعدة بيانات PostgreSQL.
قم بتشغيل `./launcher rebuild app` لإصلاحه في تثبيت قياسي.
بدلاً من ذلك، يمكنك إزالة Discourse AI لإعادة البناء.
------------------------------خطأ Discourse AI----------------------------------
قاعدة بياناتي هي خادم RDS Aurora بدون خادم v2 وبالتالي لا يمكنها استخدام امتداد pgvector. هل هناك فرصة لتكوين السلوك القديم؟
هل تستخدم بلا خادم لقاعدة بيانات Discourse الرئيسية أو فقط لقاعدة تضمين البيانات؟ يقوم Discourse AI الآن بتخزين تضمينات البيانات في قاعدة البيانات الرئيسية ويتطلب تمكين امتداد pgvector هناك. وهو متاح على RDS PostgreSQL 13.11 والإصدارات الأحدث. نحن لا نستخدم Aurora في بيئة الإنتاج، فقط RDS PostgreSQL، لذا هذا هو الشيء الوحيد الذي يمكنني أن أوصي به لك.
ليس في الوقت الحالي، حيث يتطلب ذلك مني الاحتفاظ بمستودعين منفصلين، أحدهما يحتوي على رمز التطبيق والآخر يحتوي على الأدوات الداخلية لبناء الصور ودفعها إلى مستودعاتنا الداخلية، ولم أتمكن حقًا من إيجاد وقت لإعداد ذلك بشكل صحيح.
رمز واجهة برمجة التطبيقات مرئي بالكامل داخل صورة الحاوية، حتى لو لم تكن هذه أفضل طريقة لتتبعه، على الأقل كل شيء موجود هناك.
هل يمكن لأي شخص مشاركة متطلبات الخادم الدنيا والموصى بها بالضبط لمنتدى به زوار عاديون؟ بصراحة، أرغب في تجربته، لكنني لا أعرف من أين أبدأ نظرًا لعدم وجود متطلبات خادم واضحة.
في منتدى الخاص بي، يوجد 200-250 مستخدمًا متصلاً بالإنترنت ويتم إنشاء متوسط 300 منشور يوميًا. لذلك لا يمكن تسميته بالكثير، ولهذا قلت قياسي. أفهم ما تقصده، لكنني أخطط لاستئجار خادم جديد لأن الخادم السحابي الذي أستخدمه حاليًا لا يسمح بالعديد من الترقيات. شكرًا على إجابتك
على سبيل المثال، إذا كنت ترغب فقط في اللعب بالـ embeddings، فإن خادم $6 الذي يقوم بذلك على وحدة المعالجة المركزية سيكون كافيًا وسيمنحك الوصول إلى ميزة المواضيع المتشابهة.
الآن إذا كنت تريد AIHelper و AIBot، يمكنك:
الدفع لكل مكالمة على OpenAI، وستعتمد التكلفة على استخدامك.
تشغيل نموذج لغوي مفتوح المصدر على خادم تملكه للخصوصية. نموذج مثل Llama2-70B-Chat سيحتاج إلى خادم يكلف 10 آلاف ~ 25 ألف شهريًا.
تشغيل نموذج لغوي مفتوح المصدر على خدمة الدفع بالساعة، يمكنك تشغيل نسخة مكمّاة من Llama2 في نقاط نهاية HuggingFace مقابل 6.50 دولار في الساعة وستنام تلقائيًا بعد 15 دقيقة بدون طلبات.
مجال تعلم الآلة / عمليات تعلم الآلة يتحرك بسرعة، ووحدات معالجة الرسومات نادرة للغاية وتُطلق نماذج جديدة كل يوم. من الصعب التنبؤ، كلنا نجرب.