لذلك أصدرت DeepSeek للتو نموذج الاستدلال مفتوح المصدر الخاص بها “R1” (بالإضافة إلى واجهة برمجة التطبيقات) والذي يضاهي o1 من OpenAI ولكنه يكلف حوالي GPT-4o-mini. إنه أمر مذهل ومفيد حقًا، خاصة بسبب التكلفة، ولكنه غير مدعوم حاليًا في صفحة إعداد LLM. ![]()
أوه يا إلهي، لماذا لم أفكر في ذلك… شكراً يا رجل ![]()
لقد حصلت على واجهة برمجة تطبيقات (API) واتصلت بها كما وصف @Falco، وقمت بتعديل موجه (prompt) وحصلت على استجابات مذهلة. رائع حقًا. للأسف، قرأت بعد ذلك سياسة الخصوصية وشروط الخدمة الخاصة بهم، وهم يستخدمون ويشاركون ويمتلكون كل ما تفعله. مقرهم في الصين. للأسف، على الرغم من روعتها، لا أعتقد أنه يمكنني استخدامها في المجتمع لأسباب تتعلق بالخصوصية.
هل هناك أي اقتراحات لنماذج مفتوحة المصدر يمكن استخدامها في Discourse باستخدام مفتاح API؟ يعتبر كل من Gpt4o و mini رائعين، ولكن هذه النماذج المنطقية جذابة حقًا.
هذه نقطة جيدة. لحسن الحظ، R1 مفتوح المصدر بالكامل، ولن يمر وقت طويل قبل أن يقوم شخص ما بإعادة ضبطه لإزالة اللغة الصينية منه، والتخلص من المرشحات/أجهزة الرقابة/وما إلى ذلك. ثم أظن أنه سيكون نموذجًا رئيسيًا على مختلف مزودي الخدمات السحابية (bedrock، groq، إلخ). في الوقت الحالي، لا يوجد نموذج آخر يضاهيه باستثناء o1. في الواقع، R1 أفضل قليلاً في بعض الجوانب وفقًا للمقاييس.
@MachineScholar شكراً لك على فتح هذا الموضوع وكذلك على تقييمك. أنا غارق قليلاً في عالم الذكاء الاصطناعي الجديد هذا. أنا أشرف على متدرب يقوم بتطبيق وتحليل تكاليف الذكاء الاصطناعي لنا. هل يمكنك تقديم نظرة تقريبية مبسطة حول فرق التكلفة؟
حاليًا، نقوم بتشغيل نماذج اللغة الكبيرة هذه:
- Claude 3.5 Haiku
- Claude 3.5 Sonnet
- Gemini 1.5 Flash
- GPT-4 Omni
أنا أفكر في تطبيق DeepSeek R1 لأن متدربًا آخر كان متحمسًا جدًا اليوم حول مدى روعته مقارنة بـ GPT-o4 و o1 لمهام البرمجة المحددة.
كلا المتدربين عالمي كمبيوتر وهما صغيران، لذا لا يوجد نقص في الحماس للتكنولوجيا الجديدة. ![]()
أيضًا، إذا كان منتدى Discourse الخاص بي يحتوي على بيانات عامة، فهل أحتاج إلى القلق بشأن شروط استخدام خصوصية DeepSeek؟ أعتقد أنني أفكر، إذا كان جيدًا ويوفر لي المال، فلماذا لا؟ ولكن، من الواضح، أنني لا أريد الإضرار بالمجتمع.
أهلاً! يسعدني المساعدة ![]()
حتى اليوم، إليك التكاليف من الأقل إلى الأعلى، لكل مليون رمز مميز (token):
Gemini 1.5 Flash
الإدخال: 0.075 دولار
الإخراج: 0.30 دولار
Claude 3.5 Haiku
الإدخال: 0.80 دولار
الإخراج: 4.00 دولار
Claude 3.5 Sonnet
الإدخال: 3.00 دولار
الإخراج: 15.00 دولار
GPT-4o
الإدخال: 2.50 دولار
الإخراج: 10.00 دولار
DeepSeek-R1
الإدخال: 0.55 دولار
الإخراج: 2.19 دولار
أسعار الرموز المميزة هنا لا تأخذ في الاعتبار التخزين المؤقت للمطالبات (prompt caching) التي يمكن أن تقلل التكاليف بشكل كبير. علاوة على ذلك، يبدو أن مجتمع الذكاء الاصطناعي يبلغ باستمرار أن Claude 3.5 Sonnet ينتج رمزًا أفضل باستمرار من نماذج OpenAI، على الرغم من أنني أعتقد أنها تتناوب غالبًا في جودتها.
ومع ذلك، فإن DeepSeek-R1 هو الفائز الواضح هنا لأنه ببساطة ليس فقط أفضل قيمة مقابل المال ولكن أفضل قيمة بشكل عام. لوحة المتصدرين لساحة روبوتات الدردشة (Chatbot Arena Leaderboard) تدعم ذلك أيضًا، حيث تحتل مرتبة أعلى من o1:
بالأمس تعرض DeepSeek لهجوم سيبراني شديد مما تسبب على الأرجح في عدم عمل واجهة برمجة التطبيقات الخاصة بهم، لكنني اختبرتها مرة أخرى وهي تعمل الآن. لقد فتحت موضوعًا حول هذه المشكلة أيضًا
بالنسبة للخصوصية، يذكر DeepSeek بوضوح في سياسته أن البيانات يتم تخزينها في الصين (مما يكسر القانون الأوروبي تمامًا، على سبيل المثال)، وليس سراً أن الحزب الشيوعي الصيني لديه إمكانية الوصول إلى جميع بيانات الشركات في الصين. ولكن إذا كانت جميعها بيانات عامة، فمن يهتم حقًا، بما أن موقعك يمكن نظريًا أن يتم كشطه/تعدينه على أي حال.
لحسن الحظ، هذا النموذج مفتوح المصدر بالكامل ومقدمو خدمات نماذج اللغة الكبيرة على دراية بذلك. على سبيل المثال، تقدم fireworks.ai هذا النموذج بالفعل، على الرغم من أنهم يبالغون في السعر، في رأيي، بسعر 8.00 دولارات للإدخال / 8.00 دولارات للإخراج. لذا فإن واجهة برمجة تطبيقات DeepSeek بالتأكيد اقتصادية.
في مجتمعي، أستخدم GPT-4o-mini مع RAG (يُجبر على قراءة موضوع ذي صلة قبل الرد لتوفير إجابة أكثر واقعية/مفيدة) وهندسة مطالبات صارمة. لم تفشلني أبدًا وهي رخيصة جدًا بسعر 0.15 دولار للإدخال / 0.60 دولار للإخراج. ومع ذلك، لن أثق بها حقًا في البرمجة - وهذا بالتأكيد يُترك لـ o1-mini أو DeepSeek-R1. عادةً ما يتم تخزين ثلث إلى نصف جميع الرموز المميزة المستخدمة في مجتمعي مؤقتًا (والتي يمكنك رؤيتها في /admin/plugins/discourse-ai/ai-usage) مما يقلل تكاليفي بشكل إضافي لأن الرموز المميزة المخزنة مؤقتًا أرخص بنسبة 50٪.
وبالتالي، إذا استخدم مجتمعي 2 مليون رمز إدخال و 100,000 رمز إخراج كل يوم، فإن تكاليفي التقريبية هي:
تكلفة الإدخال اليومية: حوالي 0.22 دولار
تكلفة الإخراج اليومية: حوالي 0.06 دولار
… مضروبة في 30 يومًا = حوالي 6.60 دولار للإدخال و 1.8 دولار للإخراج = 8.40 دولار شهريًا.
هذا ليس حتى ثمن وجبة غداء.
هذه مجرد مشاركة وصفية أخرى، لكنني اختبرت DeepSeek بسؤال حول التمارين وفقدان الوزن. حصلت على إجابة سيئة للغاية مع الكثير من الهلوسة. وهذا يتماشى مع تجارب أخرى سمعتها.
لذا، فإن السعر هو جزء واحد فقط من القصة. ما تحصل عليه مقابل هذا السعر هو جزء مهم أيضًا.
آه نعم، هذه نقطة جيدة بالفعل. لقد نسيت ذلك لأنني لا أستخدم نماذج اللغة الكبيرة (LLMs) عمليًا أبدًا بدون RAG أو أي شكل آخر من أشكال حقن المعلومات عندما أبحث عن المعرفة/المعلومات. يتألق R1 حقًا بالنسبة لي عندما يتعلق الأمر بالعصف الذهني للأفكار مع “التفكير النقدي”. كل هذا يتطلب هندسة أوامر ممتازة.
للتوضيح: تم تدريب R1 مع التعلم المعزز الموجه نحو التفكير منذ البداية، لذا فإن “استرجاع المعلومات” الداخلي البسيط قد ينتج عنه هلوسات بسبب “الإفراط في التفكير”. لكنني لم أقرأ ورقتهم البحثية بالكامل بعد، لذا خذ هذا مع قليل من الملح لأنه مجرد حدسي.
صحيح أيضًا أنه من السهل كسر حماية R1 ![]()
لقد حصلت أيضًا على بعض الردود غير المترابطة منه. تمكنت من استخدامه عن قصد لإنشاء زوج من الأمثلة التدريبية الجيدة التي وضعتها في ملف نصي RAG لشيء محدد. بالتأكيد ليس جاهزًا للاستخدام العام. نأمل أن تطلق OpenAI نموذج استدلال أكثر فعالية من حيث التكلفة يمكننا استخدامه.
@MachineScholar أود حقًا أن أشكرك على تحليل التكاليف الخاص بك ومساعدتي في فهم هذا. أنا غارق قليلاً في كل المعلومات الجديدة بنفسي، لكن المتدربين الشباب في علوم الكمبيوتر يبدو أنهم يمتصون المعلومات مثل الإسفنج. قد يفكرون أسرع بـ 8 مرات مني…
لدي متدرب يعمل على إضافة الذكاء الاصطناعي لمجتمعي Discourse مختلفين. نحن ندفع للمتدربين، لكنهم رخيصون وهم متحمسون بالتأكيد. المتدرب الذي يقوم بشكل أساسي بعمل الذكاء الاصطناعي هو في برنامج علوم الكمبيوتر بجامعة كاليفورنيا، وغالبًا ما أتساءل كيف تبدو المناقشات داخل الحرم الجامعي في مثل هذه المجموعة الشابة حيث المستقبل هو مستقبلهم بوضوح لخلقه.
أتساءل أيضًا كيف تبدو بيئة البحث الخاصة بك؟ يبدو أنك منخرط بعمق في التكنولوجيا. يا له من وقت رائع للانخراط. مثير للغاية.
من المحتمل أن أبدأ موضوعًا جديدًا في سؤالي التالي. المتدرب يقوم بتطبيق بحث Google المخصص والوصول إلى رموز GitHub لروبوت الذكاء الاصطناعي. لست متأكدًا تمامًا مماهية هذه. ومع ذلك، آمل أن يتمكن روبوت الذكاء الاصطناعي من الوصول إلى مستودعات GitHub للبحث في الوثائق… لست متأكدًا مما هو ممكن. لا أعرف أيضًا ما إذا كان يتم استخدام التوليد المعزز بالاسترجاع (RAG) في إضافة Discourse AI.
فيما يتعلق بفعالية DeepSeek R1 مقابل o1، كان متدرب مختلف يتحدث معي عن استخدامه لمشاريع علوم الكمبيوتر الخاصة به باستخدام واجهة الويب (باستخدام ChatGPT Plus). لذلك، كان الاختبار غير رسمي للغاية، لكن حماس المتدرب لـ DeepSeek كان كبيرًا.
المتدرب الذي يعمل بالفعل على تنفيذ الذكاء الاصطناعي كان أكثر تحفظًا بكثير بشأن الاختلافات بين نماذج اللغات الكبيرة (LLMs). إنهم يقدمون بشكل أساسي جداول التكلفة والاستخدام مع تعليقات محدودة حتى الآن حول اختلافات الاستخدام. سنجعل جميع نماذج اللغات الكبيرة متاحة للمجتمع ونطلب منهم التقييم. لذلك، من الذكاء من المتدرب الحفاظ على رأيه منخفضًا في الوقت الحالي.
شكراً لك مرة أخرى على مساعدتك في رحلتي.
Deepseek يضرب بعمق عالم الذكاء الاصطناعي والأعمال والشركات.
إنهم يفعلون المزيد بالقليل في كل جانب. يمكنك البحث عن اختلافاتهم التقنية، ووجدت معلومات على Reddit باستخدام عميل محلي لأنني لا أتفق مع سياساتهم ولكن يمكنك الوصول إليها.
لقد تأثرت بصبرهم للعمل بشكل أفضل بدون مليارات من خلال صناديق رأس المال الاستثماري. OpenAI مكلف للغاية بالنسبة للكثير من البلدان وهذا ليس ما يجب أن يكون عليه الإنترنت أو عصرنا الرقمي.
بالطبع، CPC متورط بشكل مباشر ولكن في الوقت الحاضر القوانين الغربية والحكومات المعطلة متماثلة تقريبًا.
النموذج يخضع للرقابة مثل OpenAI (ميدان تيانانمن أو غزة) ولكنه يؤدي أداءً جيدًا جدًا بتكلفة 1/10-20 من التكلفة المعتادة القديمة.
أعتقد أن هذا جيد للمستخدمين والتكنولوجيا. تحتاج الخدمات القديمة إلى تغيير نهجها أو السماح للناس بالاختيار.
يسعدني جداً أنني تمكنت من المساعدة!
نعم، أن تكون في علوم الكمبيوتر هذه الأيام يعني أن تكون قادراً على التكيف والتعلم بسرعة فائقة. إنه أمر مرهق في بعض الأحيان. أتخيل أن الجامعات المبتكرة في كاليفورنيا في الطليعة. أنا على دراية بالعديد من المختبرات في جامعات كاليفورنيا حيث يتم إجراء أبحاث متطورة في الذكاء والإدراك.
لدي حاليًا شركتي الخاصة التي أطور فيها تكنولوجيا تعليمية ذكية، وأعمل أيضًا في مختبر صغير للذكاء الاصطناعي حيث نحاول بناء عقل أولي ثم إيجاد حالة استخدام تجارية له. في المستقبل القريب، سأبدأ مختبري البحثي الخاص في مجال اهتمامي البحثي المتخصص، وهو أنظمة استكشاف الفضاء الذكية. عالم الذكاء الاصطناعي مثير للغاية - هذا صحيح - ولكن جزءًا مني يتمنى أحيانًا أن يتباطأ كل شيء حتى لا أضطر إلى اللحاق بالركب باستمرار أيضًا!
يتيح بحث Google المخصص والوصول إلى رموز GitHub لروبوت الذكاء الاصطناعي الوصول إلى بحث Google و GitHub (لأشياء البرمجة) على التوالي. أيضًا، يقوم روبوت الذكاء الاصطناعي Discourse بالفعل بتنفيذ RAG عند قراءة المواضيع أو المشاركات في المنتدى. يقرأها ثم يستخدم هذا النص كسياق إضافي لتوليد نص أكثر استنارة.
بالتأكيد من الجيد أن المتدربين لديك يعرفون كيفية متابعة الاتجاهات، ومع ذلك، سيكون من الذكاء أيضًا أن يتذكروا أن نماذج اللغات الكبيرة مبالغ فيها دائمًا، لأن ذلك مفيد للسوق. لدى مطوري نماذج اللغات الكبيرة الكبار حافز للترويج لكل شيء. على الرغم من ذلك، أعترف بأن هذه الأنظمة أصبحت أكثر إثارة للإعجاب مع مرور الوقت.
@oppman لا تتردد في إرسال رسالة خاصة في أي وقت إذا احتجت إلى أي شيء! نحن جميعًا في هذا معًا!
This topic was automatically closed 30 days after the last reply. New replies are no longer allowed.

