اختلافات زمن استجابة البحث بين البحث الدلالي بالـ AI والبحث بالكلمات المفتاحية

هل هناك أي بيانات حول زمن الاستجابة للبحث الدلالي والمواضيع ذات الصلة الدلالية مقابل البحث بالكلمات المفتاحية والمواضيع المقترحة؟

شكرا مقدما.

هل يمكنك توضيح ما تقصده بزمن الاستجابة هنا؟

بالنسبة للمواضيع ذات الصلة، نظرًا لأن كل التضمينات محسوبة مسبقًا، فلا توجد تكلفة تشغيل إضافية. بل على العكس من ذلك، فإن العثور على المواضيع ذات الصلة باستخدام استعلام SQL أسرع من استعلام المواضيع المقترحة القديم لدينا، ونقوم بتخزين المواضيع ذات الصلة مؤقتًا للحصول على أداء أسرع.

أما بالنسبة للبحث بالذكاء الاصطناعي، فإن نهج HyDE الحالي[1] الخاص بنا يسبب زمن استجابة كبيرًا، وهذا هو السبب في أنه يحدث بشكل غير متزامن ويتم تقديم البحث القياسي للمستخدم أولاً مع خيار تعزيزه بنتائج الذكاء الاصطناعي عندما تكون جاهزة. هنا على Meta، تكون نتائج بحث الذكاء الاصطناعي جاهزة بعد 4 ثوانٍ من نتائج البحث العادية، في المتوسط.


  1. GPT-4: HyDE هو اختصار لـ Hypothetical Document Embeddings، وهي تقنية تستخدم في البحث الدلالي للعثور على المستندات بناءً على أوجه التشابه في محتواها. يتيح هذا النهج نتائج بحث أكثر دقة وملاءمة للسياق من خلال تقييم أوجه التشابه المفاهيمية بين المستندات، بدلاً من الاعتماد فقط على مطابقة الكلمات المفتاحية. إنه يمثل تقنية تعلم صفرية الطلب تجمع بين قدرات فهم اللغة لـ GPT-3 ومُشفرات النصوص التباينية، مما يعزز قدرة الذكاء الاصطناعي على فهم ومعالجة بيانات اللغة الطبيعية بطريقة أكثر دقة وفعالية. ↩︎

3 إعجابات

بالضبط ما كنت أبحث عنه. شكراً فالكو.

هل تم إجراء أي تحقيق بخصوص طرق لتقليل زمن الاستجابة هذا للبحث الدلالي؟

الإصدار الأول من البحث بالذكاء الاصطناعي كان لديه زمن استجابة أفضل بكثير، ولكنه كان يعطي نتائج أسوأ بكثير.

بالنسبة للإصدار التالي، لدينا العديد من الخطط لتقليل زمن الاستجابة:

  • استخدام تضمينات على مستوى المنشور بدلاً من تضمينات على مستوى الموضوع
  • استخدام نموذج إعادة ترتيب لفرز نتائج البحث
  • جعل HyDE اختياريًا

نعتقد أن هذا سيمنحنا نتائج بحث أفضل، وسيجعله أسرع في هذه العملية. وبالاقتران مع الأجهزة الجديدة التي نقدمها بدون تكلفة إضافية لجميع عملائنا المستضافين، والتي يمكنها إجراء استدلال التضمينات في 2 مللي ثانية فقط، فإننا نبدأ للتو بما هو ممكن هنا.

إعجابَين (2)

رائع. شكراً على هذه الرؤية يا فالكو.
لدينا سؤالان آخران بينما نتطلع إلى تفعيل هذا لمجتمعاتنا.

  1. يبدو أنه عند تبديل المفتاح لعرض نتائج البحث الدلالي، فإن ما يتم عرضه للمستخدم هو مزيج من النتائج من واجهة برمجة تطبيقات البحث الدلالي وواجهة برمجة تطبيقات البحث بالكلمات المفتاحية. هل هذا صحيح؟ إذا كان الأمر كذلك، فكيف يتم ترتيب هاتين المجموعتين من النتائج مقابل بعضهما البعض؟
  2. وبالمثل، هل يمكنك التعليق على كيفية عمل “الفرز حسب:” مع النتائج الدلالية. ألاحظ، على سبيل المثال، مقالاً له أيقونة نجمة بجانبه في فرز واحد ثم لا يكون له في فرز آخر.



إعجاب واحد (1)

نعم، بالضبط.

باستخدام تقنية تسمى “دمج الرتب المتبادلة”. قد ننتقل إلى إعادة ترتيب في المستقبل.

البحث الدلالي غير متوافق مع خيارات الفرز، حيث لا يوجد لدينا أي حساب لقطع المسافة. من المفترض أن يتم تعطيل / منع أي ترتيب زمني بخلاف الصلة.

إعجاب واحد (1)

رائع، شكرًا فالكو. بناءً على ما نراه، فإن واجهة برمجة تطبيقات البحث الدلالي توفر نتائج البحث الدلالي للعميل فقط. لذا، يُفترض أن دمج الترتيب التبادلي يحدث على العميل. هل هذا صحيح؟ أيضًا، هل سيكون لدينا خيار تغيير خوارزمية إعادة الترتيب هذه بأنفسنا إذا أردنا تجربة خيارات مختلفة بأنفسنا؟

إعجاب واحد (1)

نعم، بالضبط،

من الناحية الفنية، بما أن كل شيء يعتمد على العميل، يمكنك تجاوز ذلك.

ومع ذلك، على المدى الطويل، أرى أننا سنعتمد بشكل متزايد على نماذج إعادة الترتيب، والتي ستكون جميعها من جانب الخادم لأسباب واضحة.

حسنا. شكرا لك!

إعجاب واحد (1)