Add search synonyms

I have been reading a lot here lately and see that ‘post’ and ‘reply’ seem to be used somewhat interchangeably.

If this were done, it would result in fewer bothersome questions when someone uses the wrong one of the two for their searching before they ask a question with a new topic (LOL it just happened to me, ‘delete post after’ did not produce the same results as ‘delete reply after’…)

Hence my topic question…

إعجاب واحد (1)

Reply and post are not 100% interchangeable. In most usage we see here on Meta they are, but not always.

I’d suggest reviewing Discourse New User Guide, which describes what a post is. A reply is any post that is not the OP.

5 إعجابات

But I would rather find what I am searching for even if I do not know the correct terminology.

For those more ‘in the know’, would they not still have the option of doing explicit searches with quotes around their explicit term of interest, for example “reply” :question:

Thanks, I will read that but do many other people read that before they make new topics here?

So, I read the ‘Discourse New User Guide’ and I am unable to find any explicit definition of ‘reply’.

But as I have quoted you above, a ‘reply’ is necessarily a ‘post’, so when someone searches for ‘post’ all ‘reply’ matches should also be presented…

Whether, a search for ‘reply’ should bring up all ‘post’ entries is also unknown after reading that guide.

So, I would still like to have the request of this topics’ title, acted upon. (but again, that is only my opinion)

A reply is necessarily a post but some posts are not replies so searching on post should not automatically add the reply search term.

If your preference is satisfied then it will annoy other users like myself who are only searching for post and not reply.

3 إعجابات

But you are obviously ‘in the know’ and would likely just use an explicit search term without bothering people here with a new topic about why so many search results for ‘post’ are showing up in your ‘reply’ searches.

Regardless of the semantics of post/reply — adding synonyms to search isn’t something that can be configured in Discourse at the moment.

9 إعجابات

Ok, that shuts me up :wink: but perhaps there should be a way to add them, I predict it could lessen the burden on the good people who respond to newbies on this great forum :slight_smile:

Actually, I do general searches and then follow relevant links that have some overlap with what I’m searching for.

Search engines have an idea of which links are followed. Discourse has something similar. “Suggested messages” at the end of the topic are a fruitful source of relevant topics not directly related to the specific search terms.

إعجاب واحد (1)

I am recategorizing it as feature the feature request is pretty clear to me. It is asking for a place in the UX to define custom synonyms.

Postgres technically supports synonyms per:

So if you wanted to get your gloves off and be mega technical you could wire something today, but I agree that some time in the future adding a UI to allow mods to define this may be interesting.

Not putting a pr-welcome on this cause it is complicated and would take quite a while to get right with possible limited benefit.

Timeframe wise I would say this is something I expect not to get to in the next year and probably to get to within the next 5 years.

9 إعجابات

Congratulations Dale :partying_face:

image

إعجاب واحد (1)

لقد أجرينا تحديثًا لمصطلحاتنا (أصبح المستخدم الآن “عضو”) وقمنا بتحديث وثائقنا وفقًا لذلك، ولكنني أود أن أتمكن من جعل أي شخص يبحث عن المستخدم يرى تلقائيًا النتائج التي تذكر “عضو”. أي أفكار حول طريقة سهلة لتحقيق ذلك؟

CC: @michellefs

إنها مهمة صعبة إلى حد ما، يمكننا بناء إضافة تقوم بحقن المرادفات في البيانات المفهرسة - ولكننا نتحدث عن أي شيء يتراوح بين يوم واحد وخمسة أيام عمل.

أعتقد أن السؤال الكبير هنا هو مدى أهمية هذا الأمر بالنسبة لك؟ يمكن القيام بذلك ولكنه يتطلب بعض الاستشارات المخصصة من جانبنا.

إعجاب واحد (1)

لا أعرف شيئًا، ولكن أليس هذا مجرد مسألة تغيير النصوص من جانب التخصيص؟ أم أنني، كالعادة، أفهم خطأ تمامًا؟

أعتقد أن الأمل هو أن تكون هناك القدرة على التأثير على خوارزمية البحث بشكل غير مباشر من خلال أداة مثل مرادفات العلامات. ولكن لأي كلمات رئيسية داخل منشور (أو المنشور الأصلي، على الأقل).

مثال على حالة استخدام سيكون لأعضاء المجتمع/زوار الموقع الذين يبحثون عن عباراتهم العامية بدلاً من مصطلحات العلامة التجارية المماثلة. تعطي خوارزمية البحث الأولوية لمواضيع مختلفة جدًا. مثال على موقعنا سيكون البحث عن مواضيع “تطبيق سطح المكتب” مقابل “العميل الأصلي”.

فضولي لمعرفة ما إذا كانت وجهات النظر حول الأخطاء الإملائية قد تغيرت على مر السنين:

في Discourse-AI، بدأنا في تجربة البحث الدلالي. لا يزال هذا في مراحله الأولى ولا نزال نستكشف هذه الأنظمة.

استخدام نماذج اللغة الكبيرة لتحسين موجه البحث هو أيضًا نهج ممكن (وإن كان بطيئًا اليوم):

تم ذكر هذه التقنية هنا: GitHub - texttron/hyde: HyDE: Precise Zero-Shot Dense Retrieval without Relevance Labels


إلى جانب الأساليب المؤتمتة بنسبة 100٪

استراتيجيتنا العامة هنا هي التكرار. لدينا بالفعل “كلمات مراقبة” في المنتج، ولن أمانع في ميزة تضيف “مرادفات البحث” حيث تحدد الأخطاء المطبعية الشائعة والعبارات الشائعة التي ترغب في “حشوها”. إنه ليس عملًا مجدولًا ولكنه بالتأكيد شيء يمكنك النظر في رعايته.

هناك سابقة لهذه الميزة بالضبط في Postgres وفقًا لـ: https://www.postgresql.org/docs/current/textsearch-dictionaries.html#TEXTSEARCH-SYNONYM-DICTIONARY

المجال الآخر الذي أنا منفتح على استكشافه (أنا متحمس له فقط بدرجة فاترة) هو السماح بـ “بيانات وصفية” مخفية في المنشورات، حيث يمكن للمسؤولين حشو مصطلحات البحث. إنه غير مرئي للغاية وبشكل عام أوصي فقط بـ “حشو” الأعمال “بشكل صحيح” حتى لا يتم إخفاء الأشياء على سبيل المثال:

SEO

دلالي، ذو صلة، تحسين

إعجابَين (2)

Shocked Cosmo Kramer GIF

هذه فكرة عبقرية بحتة، فهي تحل المشكلة الرئيسية للبحث المستند إلى التضمينات: إدخال المستخدم السيئ.

وهي تتطلب الحد الأدنى من التغييرات من إعدادنا الحالي، حيث تحتاج فقط إلى إضافة خطوة صغيرة “لإثراء” استعلام البحث :exploding_head:


في هذا الموضوع، هناك شيء آخر يمكننا القيام به وهو إجراء بحث هجين:

  • البحث باستخدام البحث النصي الكامل الحالي في PG
  • البحث باستخدام التضمينات
  • جمع أفضل 50 نتيجة من كليهما
  • تمريرها إلى خدمة إعادة ترتيب البحث
  • عرض النتائج المعاد ترتيبها

نحن نقوم بالفعل بشحن مُعيد ترتيب قادر للغاية في واجهة برمجة تطبيقات التضمينات الحالية لدينا تحت نقطة نهاية منفصلة، وهذا يحتوي على جميع القطع اللازمة لحدوث ذلك.

مثال هنا:

https://github.com/pgvector/pgvector-python/blob/master/examples/hybrid_search.py#L67-L70

6 إعجابات