توضيح إعدادات تضمين Gemini API

RBoy · 15 أكتوبر 2025، 12:40ص

@Falco 2 توضيح بخصوص التضمينات:

ماذا يشير طول التسلسل في تكوين التضمين؟ هل يرتبط هذا بـ حد إدخال الرموز كما هو موضح هنا: https://ai.google.dev/gemini-api/docs/embeddings#model-versions
كيف يمكن للمرء تحديد معدل واجهة برمجة تطبيقات التضمين؟ اضطررت إلى إعادة تعيين نموذج التضمين بسبب إيقاف النموذج القديم من Gemini، لذا فهو يحاول الآن إنشاء متجهات جديدة للمنتدى بأكمله (إذا فهمت مشاركتك الأخرى بشكل صحيح). المشكلة هي أنه يفعل ذلك بسرعة كبيرة ويواجه رفض طلبات 429 كثيرة جدًا من Gemini. هل هناك طريقة لتخفيفه؟ أنا ضمن حدود RPD/TPM ولكن لوحة تحكم Gemini تظهر أن discourse يضرب واجهة برمجة التطبيقات مرات كثيرة جدًا. سأكون ممتنًا لأي نصيحة قد تكون لديك هنا (كل شيء كان يعمل بشكل جيد حتى اضطررت إلى إنشاء نموذج تضمين جديد بسبب إيقاف النموذج القديم لـ Gemini).

كل شيء ضمن حدود المعدل:

ولكنني أحصل على الكثير من أخطاء 429 (طلبات كثيرة جدًا):

Falco · 15 أكتوبر 2025، 3:36م

نعم، إنه 2048 لهذا النموذج المحدد، ولكن يمكنك تكوينه إلى قيمة أقل لتوخي الحذر نظرًا لأن واجهة برمجة تطبيقات Gemini تفتقر إلى معلمة الاقتطاع التلقائي.

إعداد موقع مخفي يسمى ai_embeddings_backfill_batch_size. حاول تعيينه إلى 50 إذا كان موفر واجهة برمجة التطبيقات الخاص بك لا يمكنه التعامل مع الإعدادات الافتراضية الخاصة بنا.

RBoy · 16 أكتوبر 2025، 2:36ص

شكرًا. تم ضبطه على 50 وما زلت أحصل على آلاف الأخطاء. سأحاول خفضه إلى 20 وأرى كيف يسير الأمر.
ربما يجب التفكير في إضافة ai_embeddings_backfill_batch_size إلى شاشة تجربة المستخدم لتكوين التضمين، حيث قد يؤثر هذا على العديد من المستخدمين الذين يستخدمون خطط Gemini الأساسية للمواقع الصغيرة (وربما لموفرين آخرين).

RBoy · 16 أكتوبر 2025، 3:05ص

على صعيد آخر، يبدو أن هذه هي حجم الدفعة، وعدد الطلبات في استدعاء واحد. ربما تكون المشكلة هي عدد الطلبات التي يتم إجراؤها في الدقيقة (وليس لكل دفعة). هل هناك طريقة لتحديد عدد طلبات الملء الخلفي التي يتم إرسالها في الدقيقة أو في الساعة؟

وجدت أيضًا هذا إذا كان يساعد المستخدمين الآخرين، فإن تضمين gemini الجديد يواجه مشكلات مع الحدود المعينة على 0 إذا تم تجاوزها. هناك حل مؤقت لاستخدام تضمين النص بدلاً من ذلك أو ربما الانتظار قليلاً لمعرفة ما إذا كان سيتم حل المشكلة. ومع ذلك، ما زلت أعتقد أنها فكرة جيدة لـ discourse لإضافة خيار لتحديد عدد استدعاءات واجهة برمجة التطبيقات في الدقيقة للملء الخلفي لتجنب هذه المشكلة في المقام الأول.

ملاحظة: من الرائع جدًا رؤية Google تستخدم أيضًا discourse - أتساءل ما هو الذكاء الاصطناعي الذي يستخدمونه لتشغيل بحث المنتدى الخاص بهم

tobiaseigen · 15 نوفمبر 2025، 3:06ص

تم إغلاق هذا الموضوع تلقائيًا بعد 30 يومًا من آخر رد. لم يعد يُسمح بالردود الجديدة.

الموضوع		الردود	مرات العرض
"Net::HTTPBadResponse" errors on Gemini Embeddings Bug ai , related-topics	14	519	29 فبراير 2024
Gemini Embeddings Issue After Discourse Update to 3.6.0 Beta 2 Support ai	4	150	14 أكتوبر 2025
Gemini embedding setting not passing output_dimensionality? Support embedding , ai	4	257	7 نوفمبر 2025
Ai:embeddings:backfill - Handling OpenAI's 400 Error for Excessive Tokens in Embeddings Bug ai	10	893	15 مارس 2024
Warning of embedding `input must have less than 8192 tokens` with discourse ai Support ai	5	131	3 نوفمبر 2025

توضيح إعدادات تضمين Gemini API

الموضوعات ذات الصلة