استضافة ذاتية للـ Embeddings لـ DiscourseAI

Discourse · 8 يناير 2024، 8:49م

يحتوي المكون الإضافي Discourse AI على العديد من الميزات التي تتطلب تضمينات للعمل، مثل المواضيع ذات الصلة، والبحث بالذكاء الاصطناعي، واقتراح فئة وعلامة مساعد الذكاء الاصطناعي، وما إلى ذلك. بينما يمكنك استخدام واجهة برمجة تطبيقات لطرف ثالث، مثل تكوين مفاتيح API لـ OpenAI، تكوين مفاتيح API لـ Cloudflare Workers AI أو تكوين مفاتيح API لـ Google Gemini، فقد قمنا ببناء Discourse AI منذ اليوم الأول لعدم الارتباط بهذه الخدمات.

التشغيل باستخدام HuggingFace TEI

توفر HuggingFace صورة حاوية رائعة يمكنها تشغيلك بسرعة.

على سبيل المثال:

mkdir -p /opt/tei-cache
docker run --rm --gpus all --shm-size 1g -p 8081:80 \
  -v /opt/tei-cache:/data \
  ghcr.io/huggingface/text-embeddings-inference:latest \
  --model-id BAAI/bge-large-en-v1.5

يجب أن يؤدي هذا إلى تشغيل نسخة محلية من BAAI/bge-large-en-v1.5، وهو نموذج مفتوح المصدر عالي الأداء جدًا.
يمكنك التحقق مما إذا كان يعمل باستخدام

curl http://localhost:8081/ \
    -X POST \
    -H 'Content-Type: application/json' \
    "{ \"inputs\": \"Testing string for embeddings\" }"

والذي يجب أن يعيد مصفوفة من الأرقام العشرية في التشغيل العادي.

جعله متاحًا لمثيل Discourse الخاص بك

في معظم الأوقات، ستقوم بتشغيل هذا على خادم مخصص بسبب تسريع وحدة معالجة الرسومات. عند القيام بذلك، أوصي بتشغيل وكيل عكسي، وإجراء إنهاء TLS، وتأمين نقطة النهاية بحيث لا يمكن الاتصال بها إلا بواسطة مثيل Discourse الخاص بك.

تكوين DiscourseAI

يتضمن Discourse AI إعدادات الموقع لتكوين خادم الاستدلال للنماذج مفتوحة المصدر. يجب عليك توجيهه إلى خادمك باستخدام علامة التبويب Embeddings في إعدادات المسؤول للمكون الإضافي للذكاء الاصطناعي.

satonotdead · 14 فبراير 2024، 1:51ص

هل يجب أن يعمل النموذج bge-m3 مع المواقع متعددة اللغات (أو غير الإنجليزية)؟

Falco · 14 فبراير 2024، 4:14ص

نعم، لقد لعبت بها الأسبوع الذي تمت مشاركته فيه بصمت على GitHub وهي تعمل بشكل جيد. ما زلت أنتظر رؤية كيف ستظهر على لوحات المتصدرين MTEB، حيث لم تكن هناك آخر مرة نظرت فيها.

ومع ذلك، لدينا مثيلات Discourse مستضافة كبيرة تستخدم المكون الإضافي متعدد اللغات الذي يتم شحنه، e5، وهو يؤدي أداءً جيدًا جدًا.

satonotdead · 14 فبراير 2024، 2:24م

شكراً، هل كانت لديك خطط لتمكين نقاط النهاية المخصصة مفتوحة المصدر للتضمينات؟ أحاول استخدام هذه النماذج على Huggingface.

Falco · 15 فبراير 2024، 10:48م

عذرًا، لا أفهم ما تحاول نقله هنا. هذا الموضوع هو دليل حول كيفية تشغيل نماذج مفتوحة المصدر لتضمينات Discourse AI.

satonotdead · 16 فبراير 2024، 2:37م

أوه، عذرًا على ذلك. أحاول استخدام نموذج مفتوح المصدر من نقطة نهاية مخصصة لـ HuggingFace وأتساءل عما إذا كان ذلك ممكنًا أو ما إذا كان ضمن الخطط للتمكين في المستقبل القريب

fokx · 28 أبريل 2024، 3:40ص

للتحقق مما إذا كان يعمل، فإن الأمر التالي يعمل معي (مع نموذج BAAI/bge-m3):

curl -X 'POST' \
  'http://localhost:8081/embed' \
  -H 'Content-Type: application/json' \
  -d '{ "inputs": "Testing string for embeddings"}'

بالمناسبة، يمكنك أيضًا استخدام واجهة ويب Swagger على http://localhost:8081/docs/.

Isambard · 16 مايو 2024، 8:19م

هذا أيضًا خادم تضمينات لطيف:

Isambard · 29 نوفمبر 2024، 1:06م

لتوفير المساحة، هل من الممكن استخدام تضمينات مُكمّاة؟ أود استخدام تضمينات ثنائية مُكمّاة لتقليل حجم التخزين بشكل كبير. بعد إجراء بعض الاختبارات، حصلت على أداء يزيد عن 90% مع تخزين أقل بـ 32 مرة!

Falco · 29 نوفمبر 2024، 1:49م

نقوم بتخزين التضمينات باستخدام نصف الدقة (نصف مساحة التخزين) واستخدام التكميم الثنائي للفهارس (أصغر بـ 32 مرة) افتراضيًا منذ بضعة أسابيع، لذا فإن مجرد تحديث موقعك إلى أحدث إصدار يجب أن يوفر لك تقليلًا كبيرًا في استخدام القرص.

Isambard · 29 نوفمبر 2024، 10:27م

هل يمكنك أيضًا إضافة:

إلى نماذج التضمين المدعومة؟

Falco · 29 نوفمبر 2024، 10:53م

نخطط لجعل التضمينات قابلة للتكوين بنفس الطريقة التي فعلناها مع نماذج اللغة الكبيرة (LLMs)، لذا ستكون أي نموذج متوافقًا قريبًا.

Isambard · 30 نوفمبر 2024، 12:00ص

إذا واجه أي شخص آخر مشاكل مع نقاط النهاية على الشبكة المحلية مثل 192.168.x.x - يبدو أن هذه محظورة بواسطة discourse (يفترض لأسباب أمنية) ويجب تجاوز الحظر. لقد أضعت بعض الساعات في اكتشاف ذلك!

Isambard · 30 نوفمبر 2024، 8:19ص

@Falco سيكون ذلك رائعًا. في غضون ذلك، إذا أردت أن أحاول إضافة نموذج تضمين جديد، فهل أحتاج فقط إلى إضافة:

 lib/embeddings/vector_representations/mxbai-embed-xsmall-v1.rb
 lib/tokenizer/mxbai-embed-xsmall-v1.rb
 tokenizers/mxbai-embed-xsmall-v1.json

وتعديل lib/embeddings/vector_representations/base.rb لتضمين النموذج الجديد، أم أن هناك شيئًا آخر أحتاج إلى تغييره أيضًا؟

Isambard · 30 نوفمبر 2024، 2:11م

@Falco لقد جربت إضافة النموذج وأرسلت طلب سحب. أعتذر إذا ارتكبت خطأ ما لأنني لست مطور برامج حقًا. كنت آمل أن تتمكن من إلقاء نظرة عليه ومعرفة ما إذا كان مناسبًا للإدراج.

للأسف، لم أتمكن من جعله يعمل مع TEI. تمكنت من جعل all-mpnet يعمل مع TEI، لكن أعتقد أن هناك خطأ ما فيما فعلته لجعل mxbai يعمل.

بالمناسبة، هل هناك أي فرصة لدعم https://github.com/michaelfeil/infinity كخادم تضمين؟

تعديل: أرى أن هذا سيكون فوضويًا لأن فهارس HNSW في قاعدة البيانات تبدو مبرمجة بشكل ثابت، لذا يجب إضافة النماذج الجديدة في النهاية لتجنب تعطيل الترتيب، ويحتاج كل نموذج جديد إلى إضافة فهرسه الخاص.

Falco · 30 نوفمبر 2024، 10:51م

أنا أوصي بشدة بالانتظار بضعة أسابيع حتى نقوم بشحن دعم التضمينات القابلة للتكوين.

يجب أن يعمل هذا بشكل جيد عندما نقوم بشحن التضمينات القابلة للتكوين، ولكن بدافع الفضول، ما الذي سيجلبه هذا فوق https://github.com/huggingface/text-embeddings-inference؟

Isambard · 3 ديسمبر 2024، 11:55م

لم أتابع TEI لذا لن أذكر المزايا التي لم أختبرها مؤخرًا، ولكن من بين الأشياء التي رأيتها مؤخرًا:

دعم الأجهزة: infinity لديه دعم أفضل لوحدة معالجة الرسومات (GPU) من TEI
يمكن لخادم infinity استضافة نماذج تضمين متعددة في خادم واحد (ما لم أفتقد هذا في TEI)

إنه لطيف جدًا. إذا لم تكن قد جربته، فيجب عليك إلقاء نظرة!

michaelfeil · 31 ديسمبر 2024، 2:45م

قام صديق بإرسال هذا الموضوع لي عبر الرسائل المباشرة.

بعض الإيجابيات/السلبيات:

يدعم infinity تضمينات متعددة الوسائط (أي إرسال صور/صوت) إلى
دعم بطاقات الرسوميات AMD
نماذج متعددة مدعومة في نفس الحاوية (تحكم في النموذج عبر المعلمة model).
أنواع بيانات إضافية مثل تكميم int8 للأوزان (هذا غير مهم في الغالب، ذاكرة التنشيط أكبر)
غالبًا ما تظهر نماذج جديدة عبر “رمز نمذجة مخصص” يتم شحنه في مستودع huggingface. يقرأ Infinity رمز pytorch هذا إذا لزم الأمر. سيساعدك هذا على تجنب “هل يمكنك دعم نماذج كذا وكذا” بشكل مستمر)
المزيد من النماذج المدعومة (مثل debertav2 لـ mixedbread)

السلبيات:

وقت البدء البارد لـ TEI أفضل

sam · 15 يناير 2025، 11:23م

مرحباً مايكل

لقد كان @roman مشغولاً بإعادة هيكلة إعدادات التضمين الخاصة بنا على:

github.com/discourse/discourse-ai

FEATURE: configurable embeddings

main ← data_driven_embeddings

opened 02:54PM - 06 Jan 25 UTC

romanrizzi

+2124 -1001

Adds a way to configure embeddings similar to what we already have for other con…cepts like LLMs, tools, personas, etc. It hides many old settings and adds a new one called "ai_embeddings_selected_model". We include a data migration to seed the model using these old settings. It also removes the `DiscourseClassifier` service. <img width="1131" alt="Screenshot 2025-01-13 at 11 33 39 AM" src="https://github.com/user-attachments/assets/f6be2f98-1cc6-4bf9-a7d3-2aeb289f353f" /> --- <img width="545" alt="Screenshot 2025-01-13 at 11 33 45 AM" src="https://github.com/user-attachments/assets/5f541f6b-0919-42ba-8182-4f84f8c5ab8a" /> --- <img width="572" alt="Screenshot 2025-01-13 at 11 33 51 AM" src="https://github.com/user-attachments/assets/7310580c-64cd-4194-b536-0511e9ea7e81" />

يجب أن ننتهي قريباً جداً، وبمجرد الانتهاء من ذلك، سيكون إضافة الدعم لـ inifinity أمراً بسيطاً.

ما زلت أفكر كثيراً في التضمين متعدد النماذج، فهو يمنحك اختصاراً عند محاولة القيام بـ RAG على ملفات PDF لأنك تقوم بمعالجتها إلى صور وتضمين كل صورة، مما يتجنب الحاجة إلى OCR أو تحويل الصور المكلف إلى نص مدعوم بنموذج لغوي كبير.

بمجرد الانتهاء من طلب السحب هذا، سنكون أكثر من سعداء لإضافة دعم infinity (ودعم النماذج المتعددة) إلى إعدادات التضمين.

شكراً لمرورك

Isambard · 23 يناير 2025، 11:45ص

أتساءل عما إذا كان بناء دعم litellm قد يوفر طريقًا مختصرًا، حيث تستفيد بعد ذلك من جميع النماذج المدعومة عبر litellm. يبدو أن المشاريع الأخرى تدمج هذا.

الموضوع		الردود	مرات العرض
Can´t set ai embedding model Support ai	4	89	16 يوليو 2025
Discourse AI - Embeddings Site Management ai , ai-search , related-topics	24	6029	15 أكتوبر 2025
What do I need to insert into the 'ai embeddings discourse service api endpoint' Support ai	3	150	7 يناير 2024
Discourse AI - Self-Hosted Guide Self-Hosting ai	61	12406	30 أبريل 2025
Estimating cost of enabling Discourse AI for related content and search Support ai	2	46	28 أكتوبر 2025

استضافة ذاتية للـ Embeddings لـ DiscourseAI

التشغيل باستخدام HuggingFace TEI

جعله متاحًا لمثيل Discourse الخاص بك

تكوين DiscourseAI

الموضوعات ذات الصلة