ملحق سحابة الكلمات لـ Discourse؟

هل توجد إضافة سحابة كلمات لمنصة ديسكورش؟

كارل

3 إعجابات

ليس هناك… هل هناك سبب محدد لرغبتك في الحصول على واحد؟ كيف سيتم استخدامه؟

6 إعجابات

سيكون ذلك رائعًا بطريقتين. أولاً، سحابة كلمات يمكن النقر عليها لعرض جميع المواضيع المطابقة للكلمة التي تم النقر عليها، مثل “المشترك”. ثانياً، يمكنك عرض أنواع أخرى من البحث مثل هذا، أو أبرز الناشرين، أو أي شيء آخر تريده. ربما يمكن أن يكون شيئًا يُشغّل في مهمة مجدولة مرة واحدة يوميًا أو أكثر تكرارًا.

إعجاب واحد (1)

ظننت أن هذه فكرة ممتعة :game_die: … لذا قمت بإنشائها*

هي في مرحلة مبكرة جداً ‘تعمل فقط’ وتحتاج إلى كثير من التحسينات والخيارات الإضافية وربما بعض وظائف النقر:

تضيف رابطاً في قائمة الهامبرغر الخاصة بك. :tada:

:warning: انتبه: حالياً تقوم ببناء إحصائيات الكلمات من جميع المنشورات، بغض النظر عن النوع والموقع. قد يعمل هذا فعلياً كـ تسريب خفيف للخصوصية عبر مسارات معقدة (قد نحتاج إلى بعض الإجراءات الإضافية لاستبعاد الكلمات من المنشورات في المناطق الخاصة). ومع ذلك، يجب أن تكون مسجلاً للدخول لرؤيتها والوصول إلى البيانات … والكلمات يتم عرضها بصيغة SVG … وتعرض فقط أعلى مائة كلمة، لذا من غير المرجح أن تكون مصدر قلق لمعظم المواقع. سأعمل على ذلك لجعلها أكثر أماناً، ولكن بهذه الطريقة يتم تنفيذ الاستعلام بسرعة كبيرة.

استمتع. :man_dancing:

*تعتمد على بعض المكتبات الموجودة الرائعة التي تم ذكرها في المستودع. تحية خاصة إلى @DiscourseMetrics الذي استندتُ إلى استعلامه.

15 إعجابًا

رائع جدًا. أعتقد أنك أيضًا قد ترغب في عدم تضمين كلمات معينة في سحابة الكلمات؟

إعجاب واحد (1)

بالتأكيد، فهي تحتاج إلى مجموعة كاملة من الاستثناءات المنطقية، ويجب تحسين التعبيرات النمطية (regexes) للتخلص من تنسيق Markdown وما إلى ذلك دون جعلها معقدة بشكل مفرط. هذا مجرد بداية. لقد أضفت بعض الألوان للتو.

إعجابَين (2)

لكن لأكون واضحًا، هذا رائع حقًا lol

إعجاب واحد (1)

تمت إضافة قائمة محلية لكلمات التجاهل:

وهو ما يجب أن يجعل النتائج أكثر إثارة للاهتمام قليلاً…

كما أضفت الكثير من منطق التنقية، لذا فإن النتيجة أفضل بكثير.

3 إعجابات

رائع! :heart_eyes_cat: أعجبني هذا الجهد. عمل رائع. إذا كان بإمكاني طلب ميزات:

  • اجعل رابط قائمة الهامبرغر اختياريًا (أحب فكرة أن يكون هذا سرًا مخفيًا)
  • إنشاء إعداد للفئة، لتشمل فقط الفئات المحددة
  • توفير مسار للفئة بحيث يمكنك توليد سحابة كلمات لفئة واحدة فقط والفئات الفرعية، مثل /wordcloud/category

إليك كيف يبدو الأمر في منتدى حيّتي.

4 إعجابات

يعمل بشكل جيد، يحتاج إلى ضبط دقيق:

3 إعجابات

ملاحظات ممتازة، شكرًا لك، وبعض الأفكار الجيدة!

نعم، يبدو هذا نهجًا جيدًا. أنا مشغول حاليًا بعمل عميق مع العملاء، لكنني سأنظر في اختيار الفئة للتحديث القادم.

إعجابَين (2)
  • يتم اختيار الفئة في:

    FEATURE: restrict word stats to specific Categories · merefield/discourse-word-cloud@0777adc · GitHub

    إذا لم تحدد أي فئة (الافتراضي)، فستحصل على مسح لجميع منشورات المنتدى (الرسائل الخاصة وجميعها). وإذا أضفت فئة واحدة فقط، فإن إحصائيات الكلمات تقتصر على تلك الفئة وما إلى ذلك.

    image

  • كما تم إجراء تحسينات هائلة على التعبيرات النمطية (:sweat_smile: :stuck_out_tongue: )، والتي تقوم الآن بتنظيف “البيانات الخام” بشكل جيد والتخلص من معظم، إن لم يكن كل، تنسيقات Markdown.

ملاحظة: يتم تحديث إحصائيات الكلمات كل ساعة الآن (وهو أمر ربما يكون مفرطًا، لكنه يسهل مؤقتًا فحص التغييرات في بيئة الإنتاج بينما نمر بمرحلة تطور أولي كبير للكود).

ملاحظة رقم 2: لم أضع في اعتباري بعد لغات أخرى غير الإنجليزية (لم يتم اختبارها بالتأكيد). قد لا تعمل معالجة الكلمات الحالية بشكل جيد في بعض اللغات. الترحيب بالاقتراحات وطلبات الدمج (PRs).

3 إعجابات

رائع! إليك كلمة ملونة محدثة تتضمن فقط الفئات الأكثر صلة.

مجتمعي صغير ولا يزال جديدًا نسبيًا. وبصراحة، فإن المعلومات المعروضة في الكلمة الملونة تبدو جميلة لكنها ليست ذات معنى أو فائدة خاصة. أعتقد أنه يمكن استخدامها كعنصر بصري في موضوع استعادي حول المجتمع أو ما شابه ذلك. سيكون من الممتع رؤية المزيد من الأمثلة حول كيفية استخدام الناس لهذه الأداة.

بعض الكلمات المضمنة شائعة ولا تحمل معنى، مثل: youd، off، got، add، إلخ. أتساءل عما إذا كان إعداد “تجاهل جزء من سحابة الكلمات” (والذي هو 100 بالنسبة لي، وهو الإعداد الافتراضي) يؤدي وظيفته؟ أم ربما توجد قائمة أخرى/أفضل للكلمات التي يجب تجاهلها؟

إعجاب واحد (1)

نعم، يسعدني النظر في قائمة أكبر (لقد وجدت قائمة مكونة من 200 كلمة هنا، لكنني فضّلت ويكيبيديا كمصدر أكثر “موثوقية”)

إعجاب واحد (1)

حسنًا، لقد قمت بما يلي:

  • وسّعت قائمة التجاهل لتشمل 300 كلمة، باستخدام قائمة عثرت عليها هنا
  • حسّنت التعبيرات النمطية (regex) لحذف علامات الاقتباس (حتى لا تظهر كلمة ‘quote’ بكثرة!)
  • أزلت عملية الحذف التعسفية للعشر كلمات المتبقية الأعلى ترددًا، والتي أصبحت زائدة عن الحاجة بعد إضافة قائمة التجاهل.

ملاحظة: إذا كانت هناك كلمات لا تزال ترغب في استبعادها، ما عليك سوى إضافتها في بداية:

كما فعلت هنا (مثلًا: ‘ive’، ‘its’، ‘topic’، ‘post’)

لملاحظة تأثير أي تغييرات بسرعة أكبر، ببساطة أعد تشغيل المهمة من Sidekiq:

هذا كل شيء لفترة، وأقترح أن أنهي هنا. قد أنشئ موضوعًا مخصصًا قريبًا.

3 إعجابات

حسناً، قد يعجبك هذا:

تحديث: لقد بسّطت الآن ترتيب قائمة التجاهل، لذا لم يعد هناك إعداد لـ “النسبة” من قائمة التجاهل المستخدمة؛ ما عليك سوى حذف أو إضافة كلمات إلى قائمة التجاهل باستخدام الإعداد المحلي الأصلي:

https://github.com/merefield/discourse-word-cloud/commit/074e0902269e752c11c3c29018f8c68c813327d3

إعجابَين (2)

هل نحتاج إلى إلغاء تثبيت الإصدار القديم للحصول على هذا؟

إعجاب واحد (1)

يجب أن تحتاج فقط إلى ترقية البرنامج المساعد. هل تواجه مشاكل؟

نعتذر، لقد وجدنا الحل. :sunglasses:

إعجاب واحد (1)

لا توجد مشكلة على الإطلاق :+1: