أنا أستخدم Discourse AI وقد قمت بربطه بواجهة برمجة تطبيقات (API) لنموذج لغوي كبير خارجي، بالإضافة إلى بعض الإضافات (التي تأتي بتكاليف إضافية).
لهذا السبب، أود تهيئته بحيث لا يستخدم تلك الإضافات، وبدلاً من ذلك يعتمد فقط على النموذج اللغوي الكبير نفسه كمساعد للمنتدى - لأشياء مثل البحث الداخلي، أو التلخيص، أو الميزات الأخرى التي تعمل بالكامل داخل المنتدى.
السبب الرئيسي هو تقليل تكلفة الإضافات المدفوعة (مثل البحث الخارجي على الويب)، لذا أبحث عن إرشادات حول كيفية إعداد الأمور بهذه الطريقة.
شكراً
تعديل:
تلقيت رداً من المزود يفيد بأن هذا الطلب تم فرضه عليه رسوم مقابل البحث على الويب لأن الذكاء الاصطناعي استشهد بمصادر مثل بي بي سي (BBC) ورويترز (Reuters)، وغيرها، مما أدى تلقائيًا إلى تشغيل وضع الأدلة/البحث للنموذج.
إذًا، هل هذا يعني أن هذا الأمر لا يتعلق بإعدادات Discourse، ولا توجد طريقة لتعطيل هذا السلوك من جانب المزود؟
هل هناك أي حل بديل لهذا؟
اقترح المزود التحول إلى نموذج يتمتع بقدرة أقل على “التفكير”، وتجنب نماذج “الفلاش” أو “الغريزة”، ولكن هذا يعني أيضًا انخفاضًا في قدرات الاستدلال والحوسبة.
**تمت ترجمة هذه الرسالة من اللغة التايلاندية باستخدام أداة ترجمة، لذا أعتذر مقدمًا إذا كان هناك أي شيء غير واضح أو غير صحيح قليلاً.
ماذا تقصد بـ “الإضافات” (extensions)؟ أفترض أنك تقصد البحث على الويب؟
لدي موقعان مستضافان ذاتيًا يشغلان جميع ميزات Discourse AI الخاصة بي باستخدام Gemini on Google Cloud، وأنا أستخدم Google Custom Search Engine API لباحث الويب (100 استعلام مجاني/يوم). أستخدم Gemini 2.5 flash lite قدر الإمكان، مثل التلخيص والملخصات، و 2.5 flash للترجمة، ونماذج Gemini المختلفة للمهام الأكثر تحديدًا وتفكيرًا (مثل Gemini flash image).
آه، فهمت - شكرًا للتوضيح! نعم، كنت أفكر في “الإضافات” بمعنى البحث على الويب أو ميزات الذكاء الاصطناعي الإضافية.
بالنسبة لإعدادي، أستخدم واجهة برمجة تطبيقات MiMo (MiMo API) من Xiaomi، والتي تمنحني 1000 طلب شهريًا. أي استخدام لإضافات إضافية يُحتسب بشكل إضافي بناءً على الاستخدام، وللأسف لا يمكنني تعطيل ذلك. ذكر الموفر أن الأمر يعتمد على طول وتعقيد الموجه (prompt) - على سبيل المثال، إذا أدخلت أنا أو مستخدمي شيئًا مثل “ابحث عن آخر الأخبار حول…”، سواء كانت موجودة على منتدى الخاص بي أم لا، فسيقوم النموذج بإجراء بحث على الويب بالتوازي. ليس لدي أي سيطرة حقًا على تلك التكاليف الإضافية.
لم أقم بإدخال أي مفاتيح واجهة برمجة تطبيقات محرك بحث Google المخصص (Google Custom Search Engine API keys) - أترك ذلك فارغًا وأستخدم الإعدادات الافتراضية لـ “Forum Helper”.
كنت أتساءل عما إذا كانت هناك أي طريقة ذكية للتعامل مع هذا؟ إذا حاولت تحديد سقف للرصيد على مستوى الموفر، فإن ذلك يقيد جميع النماذج التي أعمل عليها.
أيضًا، أعتذر إذا كانت لغتي الإنجليزية صعبة المتابعة بعض الشيء - أنا أستخدم مترجمًا للتواصل
نموذج اللغة الكبير (LLM) الذي أستخدمه هو MiMo API من Xiaomi، والذي يوفر حصة شهرية تبلغ 1000 طلب.
المشكلة هي أن استخدام بعض الإضافات (مثل البحث على الويب) يتم احتسابه بتكلفة إضافية بناءً على الاستخدام ولا يمكن تعطيلها من جانب المزود.
أوضح المزود أن:
التكلفة تعتمد على طول ونوع المطالبة (prompt).
على سبيل المثال، إذا قام أنا أو المستخدم بكتابة “ابحث عن آخر الأخبار حول…”، سواء كانت المعلومات موجودة في منتدانا أم لا، فقد يقوم النموذج بالبحث في الويب تلقائياً.
هذا يجعلني:
أجد صعوبة في التحكم في التكاليف لأن المستخدمين هم من يكتبون المطالبات بأنفسهم.
لم أقم بإدخال مفتاح واجهة برمجة تطبيقات محرك البحث المخصص من Google (Google Custom Search Engine API key).
لقد تركت هذا الحقل فارغاً واستخدمت الإعدادات الافتراضية لـ Forum Helper.
إذا حاولت تحديد سقف ائتماني من جانب المزود:
سيؤدي ذلك إلى تقييد جميع النماذج التي أستخدمها.
لا يمكن تقييد نموذج معين أو ميزة معينة فقط.
هذا مثال للسجل الذي تمكنت من فحصه:
Generation details
Model: MiMo-V2-Flash
Model ID: xiaomi/mimo-v2-flash
Provider: Xiaomi
First token latency: 12.77 seconds
Throughput: 1.5 tokens/second
Finish reason: stop
Data policy: No data training | Policy
Tokens:
- Prompt: 38065
- Completion: 20
Web search:
- Results: 5
Costs:
- Subtotal: 0
- Web search cost: 0.02
- Final cost: 0.02
Creator: hidden
Generation ID: hidden
إذا كنت تقصد استخدام نموذج لغوي كبير محلي (Local LLM)، فليس لدي خطط لإضافة نفقات على الخادم. يتطلب ذلك الكثير من المعالجة للمستخدمين الذين يزيد عددهم عن 20 مستخدمًا في وقت واحد، لذلك لن يتم تطبيق هذه الخطة. أود التركيز على استخدام واجهات برمجة التطبيقات الخارجية مثل groq وopenrouter، والتي تكون أكثر فعالية من حيث التكلفة، ومحاولة التحكم في التكاليف في هذا الجانب.
لقد وجدت الإجابة بالفعل. من خلال اختباري وملاحظاتي، كان يتم تشغيل البحث على الويب مع كل نموذج استخدمته (أو على الأقل كل نموذج جربته)، حتى بعد تبديل النماذج. يبدو أن هذه مشكلة من جانب المزود.
المشكلة هي أن البحث على الويب يصبح تكلفة خفية غير مرغوب فيها لا يمكنني التحكم فيها بشكل صحيح أو تعطيلها بالكامل، حتى عندما لا تكون ضرورية.
لقد قمت بالفعل بتصفية حسابي، وإلغاء الخدمة مع هذا المزود، وأبحث الآن عن مزود مختلف.