هل تعود وظيفة البحث بنتائج تقريبية؟

مرحباً.

كنت أبحث عن هذا الموضوع في منتدى: les passants - Autour d'une roue - Monocycle.info
عنوان الموضوع هو “les passants”
في السابق، كان البحث بـ “passants in:title” يعرض هذا الموضوع ضمن النتائج الأولى.
ولكن الآن، يعرض نتائج تقريبية:

بدلاً من “passants”، سترى “passe” و “pass” و “passage” و “passion”، وبعض هذه الكلمات حتى قبل السلسلة الدقيقة “passants”…
أفترض أن هذا خطأ؟

أخشى أنني لا أعرف ما يكفي عن البحث لمعرفة ما إذا كان ذلك مقصودًا أم لا، ولكن يمكنك إضافة علامات اقتباس مزدوجة حول كلمة لإجراء بحث مطابق إذا كان ذلك يساعد؟

على سبيل المثال: "passants"

إعجاب واحد (1)

هذا يساعد بالتأكيد، لكن السلوك الافتراضي محير.

لسبب غير معروف، عند البحث عن السلسلة النصية الدقيقة مع علامتي اقتباس مزدوجتين، فإنه يعرض أيضًا نتيجة لا تحتوي على “passants” في العنوان (ولكنها تحتوي عليها في محتوى المنشور الأول):

إعجاب واحد (1)

في اللغة الفرنسية، يتم اختزال passants إلى اللكسيم pass قبل البحث في محتويات المشاركات.

اللكسيم هو سلسلة نصية، تمامًا مثل الرمز المميز، ولكنه تم تطبيعه بحيث تتشابه أشكال مختلفة من نفس الكلمة.

4 إعجابات

أفهم.

هل الوحدات المعجمية متعلقة باللغة؟

لا أعتقد أن تقليص كلمة كهذه إلى “pass” منطقي باللغة الفرنسية. :thinking: هذا مربك أكثر من كونه مفيدًا بالنظر إلى وجود الكثير من الكلمات التي تبدأ بـ “pass” دون أن تكون مرتبطة (بشكل مباشر أو غير مباشر) بالفعل “passer”.

ولكن إذا كان بإمكاننا استهداف السلسلة النصية الدقيقة بعلامات اقتباس مزدوجة بدلاً من ذلك، فسيكون ذلك كافيًا :slight_smile:.

أيضًا، ما قصة النتيجة الثانية التي لا تحتوي على “passants” في العنوان على الرغم من استخدام علامات الاقتباس المزدوجة في لقطة الشاشة الأخيرة؟

هذه الأشياء قابلة للتكوين في Postgres، ولكن التنفيذ الفرنسي في Postgres هو الشيء الذي يقلل كل هذا:

discourse_development=# select to_tsvector('french', 'passants');
 to_tsvector
-------------
 'pass':1
(1 row)

discourse_development=# select to_tsvector('english', 'passants');
 to_tsvector
-------------
 'passant':1
(1 row)

هناك قواميس أكثر تطوراً يمكن استخدامها، ولكنها معقدة للغاية في التكوين.

3 إعجابات