الحصول على الكثير من النتائج منعدمة للبحث الدلالي

أواجه صعوبة في الحصول على أي نتائج من البحث الدلالي بالذكاء الاصطناعي، لذا أردت التحقق مع الجميع لمعرفة ما إذا كان لديكم أي أفكار حول الخطأ المحتمل.

إذا أخذت مثالاً بسيطًا وبحثت عن “shopify”، يمكنك أن ترى أنني أحصل على الكثير من النتائج العادية، ولكن لا توجد نتائج بالذكاء الاصطناعي. عندما أقارن ذلك بالبحث عن “shopify” في مجتمع Discourse Meta، يمكنك أن ترى أنني أحصل على العديد من النتائج العادية والعديد من نتائج الذكاء الاصطناعي. لقد جربت أسئلة أكثر تعقيدًا وتحديدًا، لكنني ما زلت لا أحصل على أي نتائج.

بالنسبة لإعداداتنا، نحن نستخدم gpt-4o-mini وهو مُعد بشكل صحيح ضمن LLMs. تم تمكين “AI embeddings semantic search enabled”. نحن نستخدم “text-embedding-ada-002” للتضمينات.


إعجابَين (2)

شكرا للإبلاغ، سيقوم الفريق بالاطلاع على الأمر!

شكراً سام! أردت التأكد من أنني لم أغفل شيئاً واضحاً هنا بما أن الأمر يبدو أنه يعمل بشكل أفضل على موقعك الخاص.

الشيء الوحيد الذي يتبادر إلى الذهن هو أننا ربما لم ننتهِ من إعادة ملء التضمينات على موقعك، وسنلقي نظرة.

مرحباً @tyler.lamparter،

للوهلة الأولى، هناك مشكلة واحدة وجدتها في التكوين الحالي لموقعك وهي أنك بينما تستخدم text-embedding-ada-002، فقد قمت بملء تكوينات التضمين للمطالبات، والتي لا تدعمها هذه النماذج. لقد قمت بإزالة التعليمات التي وضعتها هناك وأعدت إنشاء التضمينات على موقعك.

أقوم أيضًا بتحديث التلميح في تلك الإعدادات لمحاولة تجنب هذا الارتباك في المستقبل.

بخلاف ذلك، حاولت البحث عن “دمج شوبيفاي” وحصلت على مستند البحث الافتراضي التالي:

وهو متوافق مع ما نتوقعه.

هل يمكنك المحاولة في البحث الآن ومشاركة تجربتك؟

@Falco يبدو أن هذا يعمل بشكل أفضل بكثير، شكرًا لك! لقد أضفت المطالبات ضمن تكوين التضمين في محاولة لتحسينه، ولكن بالطبع لم يكن له أي تأثير.

إعجابَين (2)

@Falco ربما تحدثت بسرعة كبيرة. كلما أجريت بحثًا الآن، يعرض الذكاء الاصطناعي دائمًا 40 نتيجة بالضبط بغض النظر عما أبحث عنه. العديد من النتائج ليست ذات صلة أيضًا (تقترح موضوع “حول هذه الفئة” على سبيل المثال).



إعجاب واحد (1)

سأجرب باستخدام نموذج تضمين مختلف. سأبلغكم بالنتائج خلال ساعة تقريبًا.

إعجاب واحد (1)

ما هو النتيجة المثالية لنتيجة البحث لهذا الاستعلام؟

أتوقع 0 نتيجة بحث و 0 نتيجة ذكاء اصطناعي في تلك الحالة تحديدًا. نحن ندعم ES6/ECMAScript2015 JS (نعم، قديم جدًا)، ولكنه ليس موجودًا في أي منشور مجتمعي حتى الآن.

أوهوووو فهمت. لن ينجح هذا في هذه الحالة.

الطريقة التي يعمل بها بحث الذكاء الاصطناعي الحالي لدينا:

  • يأخذ إدخال المستخدم
  • ينشئ منشورًا جديدًا حوله مع مراعاة وصف المنتدى
  • يُرجع الموضوعات الأكثر تشابهًا دلاليًا معه

لا يوجد حد أدنى للمسافة حيث نقطع البحث، حيث إن معرفة حد عام يغطي جميع آلاف مثيلات Discourse أمر غير بسيط. تتم مناقشة هذا في Setting a similarity threshold for semantic search.

نحن نتطلع إلى إصدار نهج جديد سيقوم ببحث LLM + RAG أكثر قياسية وإرجاع استجابة محادثة، حيث يمكنك تعديل الموجه لقول “لم يتم العثور على نتائج”. هذا قادم في الأسابيع القادمة، وسأقوم بإعلامك هنا عندما يمكنك اختباره.

إعجابَين (2)

سيكون ذلك رائعًا. هذا ما كنت أحاول القيام به بإضافة المطالبات إلى قسم التضمينات. نظرًا لأنه لا يمكنك تعيين حد أدنى الآن، فهل هذا هو السبب في أننا نرى دائمًا حوالي 40 نتيجة؟

نعم، بالضبط.

اليوم، يعمل البحث بالذكاء الاصطناعي كنظام تجاوز الفشل عندما لا يُرجع البحث القياسي أي نتائج، ويعمل كقاموس مرادفات قوي للغاية. ومع ذلك، في حالتك، لا يحتوي استعلام البحث على أي نتائج ممكنة في المنتدى بأكمله، وهذا ليس حالة الاستخدام التي تم تصميمه لمعالجتها.

ترقبوا الإصدار التالي من البحث؛ سيكون أقرب إلى ما تريد.

3 إعجابات

هل يمكنني إعادة نموذج التضمين الخاص بنا إلى text-embedding-ada-002؟

إعجاب واحد (1)

@tyler.lamparter تحقق من Conversational AI Search coming to Discourse AI . أخبرني إذا كنت ترغب في اختباره على موقعك.

إعجابَين (2)

نعم، أود اختبار هذا على موقعنا. لقد اختبرته على موقعك ورأيت أيضًا تبديل “إخفاء 50 نتيجة تم العثور عليها باستخدام الذكاء الاصطناعي” الموجود عند إجراء بحث كامل. هل لا يزال هذا التبديل يستخدم بحث HyDE السابق؟

لا تستخدم الميزة الجديدة التبديل على الإطلاق. إنها تعرض الإجابة الحوارية فوق تجربة البحث القياسية، وهي هنا جنبًا إلى جنب مع البحث الحالي عن الكلمات الرئيسية والبحث الدلالي.

هذا ما كنت أفكر فيه. إذا كانت الميزة الجديدة تعمل بشكل جيد معنا، فقد نقوم بتعطيل تبديل HyDE.

إعجاب واحد (1)

هل يمكن ربط أداة مخصصة بهذه الشخصية؟ أفكر في أن هذا يمكن أن يكون طريقة للحصول على وثائق ذات صلة من قاعدة المعرفة الخارجية لدينا لعرضها في نتائج البحث دون التفاعل مع الروبوت.

إعجاب واحد (1)

نعم ، يمكنه فعل كل ذلك كما هو محدد في Conversational AI Search coming to Discourse AI

إعجابَين (2)