تحذير من تضمين `input must have less than 8192 tokens` مع discourse ai

هل توجد أداة لتقسيم النص المدخل إلى أجزاء؟
أو أي واجهة برمجة تطبيقات للتضمين تدعم أكثر من 8192 رمزًا؟

Message (15 copies reported)

OpenAI Embeddings failed with status: 413 body: {"code":20042,"message":"input must have less than 8192 tokens","data":null}

Backtrace

/var/www/discourse/vendor/bundle/ruby/3.3.0/gems/activesupport-8.0.3/lib/active_support/broadcast_logger.rb:218:in `block in dispatch'
/var/www/discourse/vendor/bundle/ruby/3.3.0/gems/activesupport-8.0.3/lib/active_support/broadcast_logger.rb:217:in `map'
/var/www/discourse/vendor/bundle/ruby/3.3.0/gems/activesupport-8.0.3/lib/active_support/broadcast_logger.rb:217:in `dispatch'
/var/www/discourse/vendor/bundle/ruby/3.3.0/gems/activesupport-8.0.3/lib/active_support/broadcast_logger.rb:129:in `warn'
/var/www/discourse/plugins/discourse-ai/lib/inference/open_ai_embeddings.rb:34:in `perform!'
/var/www/discourse/plugins/discourse-ai/lib/embeddings/vector.rb:45:in `block (2 levels) in gen_bulk_reprensentations'
/var/www/discourse/lib/scheduler/thread_pool.rb:118:in `block (2 levels) in wrap_block'
/var/www/discourse/vendor/bundle/ruby/3.3.0/gems/rails_multisite-7.0.0/lib/rails_multisite/connection_management/null_instance.rb:49:in `with_connection'
/var/www/discourse/vendor/bundle/ruby/3.3.0/gems/rails_multisite-7.0.0/lib/rails_multisite/connection_management.rb:17:in `with_connection'
/var/www/discourse/lib/scheduler/thread_pool.rb:118:in `block in wrap_block'
/var/www/discourse/lib/scheduler/thread_pool.rb:163:in `thread_loop'
/var/www/discourse/lib/scheduler/thread_pool.rb:174:in `block in spawn_thread'

إذا قمت باستضافة النموذج نفسه بنفسك، فقد يستغرق الأمر ما يصل إلى 32 ألف رمز.

إذا كان هذا خارج النطاق، فأنت بحاجة إلى تكوين نموذج التضمين لتقييد المدخلات إلى الحد الأقصى المسموح به لدى مزودك. بهذه الطريقة، سيقوم روبوت الذكاء الاصطناعي الخاص بنا بتقسيم الملفات التي تم تحميلها إلى أجزاء، وسيأخذ الموضوع / البحث ذي الصلة أول 8192 رمزًا في كل موضوع فقط.

إعجاب واحد (1)

كيفية تكوين نموذج التضمين؟ في الخطاب؟ أو مزود النموذج؟

أنا متأكد من أن Qwen/Qwen3-Embedding-0.6B يدعم ما يصل إلى 32 ألف رمز
وقد قمت بتكوين طول التسلسل 32 ألف

ولكن لا تزال هناك العديد من الأخطاء في التضمين

إعجاب واحد (1)

إنه يفعل ذلك إذا سمح موفرو واجهة برمجة التطبيقات (API) بذلك.

إذا حدد موفر واجهة برمجة التطبيقات (API) الخاص بك ذلك بـ 8192، فعليك اتباع قواعدهم.

إعجاب واحد (1)

حسناً، أنا أسأل مزود واجهة برمجة التطبيقات

إعجاب واحد (1)