هل هناك أي بيانات حول زمن الاستجابة للبحث الدلالي والمواضيع ذات الصلة الدلالية مقابل البحث بالكلمات المفتاحية والمواضيع المقترحة؟
شكرا مقدما.
هل هناك أي بيانات حول زمن الاستجابة للبحث الدلالي والمواضيع ذات الصلة الدلالية مقابل البحث بالكلمات المفتاحية والمواضيع المقترحة؟
شكرا مقدما.
هل يمكنك توضيح ما تقصده بزمن الاستجابة هنا؟
بالنسبة للمواضيع ذات الصلة، نظرًا لأن كل التضمينات محسوبة مسبقًا، فلا توجد تكلفة تشغيل إضافية. بل على العكس من ذلك، فإن العثور على المواضيع ذات الصلة باستخدام استعلام SQL أسرع من استعلام المواضيع المقترحة القديم لدينا، ونقوم بتخزين المواضيع ذات الصلة مؤقتًا للحصول على أداء أسرع.
أما بالنسبة للبحث بالذكاء الاصطناعي، فإن نهج HyDE الحالي[1] الخاص بنا يسبب زمن استجابة كبيرًا، وهذا هو السبب في أنه يحدث بشكل غير متزامن ويتم تقديم البحث القياسي للمستخدم أولاً مع خيار تعزيزه بنتائج الذكاء الاصطناعي عندما تكون جاهزة. هنا على Meta، تكون نتائج بحث الذكاء الاصطناعي جاهزة بعد 4 ثوانٍ من نتائج البحث العادية، في المتوسط.
GPT-4: HyDE هو اختصار لـ Hypothetical Document Embeddings، وهي تقنية تستخدم في البحث الدلالي للعثور على المستندات بناءً على أوجه التشابه في محتواها. يتيح هذا النهج نتائج بحث أكثر دقة وملاءمة للسياق من خلال تقييم أوجه التشابه المفاهيمية بين المستندات، بدلاً من الاعتماد فقط على مطابقة الكلمات المفتاحية. إنه يمثل تقنية تعلم صفرية الطلب تجمع بين قدرات فهم اللغة لـ GPT-3 ومُشفرات النصوص التباينية، مما يعزز قدرة الذكاء الاصطناعي على فهم ومعالجة بيانات اللغة الطبيعية بطريقة أكثر دقة وفعالية. ↩︎
بالضبط ما كنت أبحث عنه. شكراً فالكو.
هل تم إجراء أي تحقيق بخصوص طرق لتقليل زمن الاستجابة هذا للبحث الدلالي؟
الإصدار الأول من البحث بالذكاء الاصطناعي كان لديه زمن استجابة أفضل بكثير، ولكنه كان يعطي نتائج أسوأ بكثير.
بالنسبة للإصدار التالي، لدينا العديد من الخطط لتقليل زمن الاستجابة:
نعتقد أن هذا سيمنحنا نتائج بحث أفضل، وسيجعله أسرع في هذه العملية. وبالاقتران مع الأجهزة الجديدة التي نقدمها بدون تكلفة إضافية لجميع عملائنا المستضافين، والتي يمكنها إجراء استدلال التضمينات في 2 مللي ثانية فقط، فإننا نبدأ للتو بما هو ممكن هنا.
رائع. شكراً على هذه الرؤية يا فالكو.
لدينا سؤالان آخران بينما نتطلع إلى تفعيل هذا لمجتمعاتنا.
نعم، بالضبط.
باستخدام تقنية تسمى “دمج الرتب المتبادلة”. قد ننتقل إلى إعادة ترتيب في المستقبل.
البحث الدلالي غير متوافق مع خيارات الفرز، حيث لا يوجد لدينا أي حساب لقطع المسافة. من المفترض أن يتم تعطيل / منع أي ترتيب زمني بخلاف الصلة.
رائع، شكرًا فالكو. بناءً على ما نراه، فإن واجهة برمجة تطبيقات البحث الدلالي توفر نتائج البحث الدلالي للعميل فقط. لذا، يُفترض أن دمج الترتيب التبادلي يحدث على العميل. هل هذا صحيح؟ أيضًا، هل سيكون لدينا خيار تغيير خوارزمية إعادة الترتيب هذه بأنفسنا إذا أردنا تجربة خيارات مختلفة بأنفسنا؟
نعم، بالضبط،
من الناحية الفنية، بما أن كل شيء يعتمد على العميل، يمكنك تجاوز ذلك.
ومع ذلك، على المدى الطويل، أرى أننا سنعتمد بشكل متزايد على نماذج إعادة الترتيب، والتي ستكون جميعها من جانب الخادم لأسباب واضحة.
حسنا. شكرا لك!
