هل توجد إضافة سحابة كلمات لمنصة ديسكورش؟
كارل
ليس هناك… هل هناك سبب محدد لرغبتك في الحصول على واحد؟ كيف سيتم استخدامه؟
سيكون ذلك رائعًا بطريقتين. أولاً، سحابة كلمات يمكن النقر عليها لعرض جميع المواضيع المطابقة للكلمة التي تم النقر عليها، مثل “المشترك”. ثانياً، يمكنك عرض أنواع أخرى من البحث مثل هذا، أو أبرز الناشرين، أو أي شيء آخر تريده. ربما يمكن أن يكون شيئًا يُشغّل في مهمة مجدولة مرة واحدة يوميًا أو أكثر تكرارًا.
ظننت أن هذه فكرة ممتعة
… لذا قمت بإنشائها*
هي في مرحلة مبكرة جداً ‘تعمل فقط’ وتحتاج إلى كثير من التحسينات والخيارات الإضافية وربما بعض وظائف النقر:
تضيف رابطاً في قائمة الهامبرغر الخاصة بك. ![]()
انتبه: حالياً تقوم ببناء إحصائيات الكلمات من جميع المنشورات، بغض النظر عن النوع والموقع. قد يعمل هذا فعلياً كـ تسريب خفيف للخصوصية عبر مسارات معقدة (قد نحتاج إلى بعض الإجراءات الإضافية لاستبعاد الكلمات من المنشورات في المناطق الخاصة). ومع ذلك، يجب أن تكون مسجلاً للدخول لرؤيتها والوصول إلى البيانات … والكلمات يتم عرضها بصيغة SVG … وتعرض فقط أعلى مائة كلمة، لذا من غير المرجح أن تكون مصدر قلق لمعظم المواقع. سأعمل على ذلك لجعلها أكثر أماناً، ولكن بهذه الطريقة يتم تنفيذ الاستعلام بسرعة كبيرة.
استمتع. ![]()
*تعتمد على بعض المكتبات الموجودة الرائعة التي تم ذكرها في المستودع. تحية خاصة إلى @DiscourseMetrics الذي استندتُ إلى استعلامه.
رائع جدًا. أعتقد أنك أيضًا قد ترغب في عدم تضمين كلمات معينة في سحابة الكلمات؟
بالتأكيد، فهي تحتاج إلى مجموعة كاملة من الاستثناءات المنطقية، ويجب تحسين التعبيرات النمطية (regexes) للتخلص من تنسيق Markdown وما إلى ذلك دون جعلها معقدة بشكل مفرط. هذا مجرد بداية. لقد أضفت بعض الألوان للتو.
لكن لأكون واضحًا، هذا رائع حقًا lol
تمت إضافة قائمة محلية لكلمات التجاهل:
وهو ما يجب أن يجعل النتائج أكثر إثارة للاهتمام قليلاً…
كما أضفت الكثير من منطق التنقية، لذا فإن النتيجة أفضل بكثير.
رائع!
أعجبني هذا الجهد. عمل رائع. إذا كان بإمكاني طلب ميزات:
/wordcloud/categoryإليك كيف يبدو الأمر في منتدى حيّتي.
ملاحظات ممتازة، شكرًا لك، وبعض الأفكار الجيدة!
نعم، يبدو هذا نهجًا جيدًا. أنا مشغول حاليًا بعمل عميق مع العملاء، لكنني سأنظر في اختيار الفئة للتحديث القادم.
يتم اختيار الفئة في:
إذا لم تحدد أي فئة (الافتراضي)، فستحصل على مسح لجميع منشورات المنتدى (الرسائل الخاصة وجميعها). وإذا أضفت فئة واحدة فقط، فإن إحصائيات الكلمات تقتصر على تلك الفئة وما إلى ذلك.

كما تم إجراء تحسينات هائلة على التعبيرات النمطية (
)، والتي تقوم الآن بتنظيف “البيانات الخام” بشكل جيد والتخلص من معظم، إن لم يكن كل، تنسيقات Markdown.
ملاحظة: يتم تحديث إحصائيات الكلمات كل ساعة الآن (وهو أمر ربما يكون مفرطًا، لكنه يسهل مؤقتًا فحص التغييرات في بيئة الإنتاج بينما نمر بمرحلة تطور أولي كبير للكود).
ملاحظة رقم 2: لم أضع في اعتباري بعد لغات أخرى غير الإنجليزية (لم يتم اختبارها بالتأكيد). قد لا تعمل معالجة الكلمات الحالية بشكل جيد في بعض اللغات. الترحيب بالاقتراحات وطلبات الدمج (PRs).
رائع! إليك كلمة ملونة محدثة تتضمن فقط الفئات الأكثر صلة.
مجتمعي صغير ولا يزال جديدًا نسبيًا. وبصراحة، فإن المعلومات المعروضة في الكلمة الملونة تبدو جميلة لكنها ليست ذات معنى أو فائدة خاصة. أعتقد أنه يمكن استخدامها كعنصر بصري في موضوع استعادي حول المجتمع أو ما شابه ذلك. سيكون من الممتع رؤية المزيد من الأمثلة حول كيفية استخدام الناس لهذه الأداة.
بعض الكلمات المضمنة شائعة ولا تحمل معنى، مثل: youd، off، got، add، إلخ. أتساءل عما إذا كان إعداد “تجاهل جزء من سحابة الكلمات” (والذي هو 100 بالنسبة لي، وهو الإعداد الافتراضي) يؤدي وظيفته؟ أم ربما توجد قائمة أخرى/أفضل للكلمات التي يجب تجاهلها؟
نعم، يسعدني النظر في قائمة أكبر (لقد وجدت قائمة مكونة من 200 كلمة هنا، لكنني فضّلت ويكيبيديا كمصدر أكثر “موثوقية”)
حسنًا، لقد قمت بما يلي:
ملاحظة: إذا كانت هناك كلمات لا تزال ترغب في استبعادها، ما عليك سوى إضافتها في بداية:
كما فعلت هنا (مثلًا: ‘ive’، ‘its’، ‘topic’، ‘post’)
لملاحظة تأثير أي تغييرات بسرعة أكبر، ببساطة أعد تشغيل المهمة من Sidekiq:
هذا كل شيء لفترة، وأقترح أن أنهي هنا. قد أنشئ موضوعًا مخصصًا قريبًا.
حسناً، قد يعجبك هذا:
تحديث: لقد بسّطت الآن ترتيب قائمة التجاهل، لذا لم يعد هناك إعداد لـ “النسبة” من قائمة التجاهل المستخدمة؛ ما عليك سوى حذف أو إضافة كلمات إلى قائمة التجاهل باستخدام الإعداد المحلي الأصلي:
https://github.com/merefield/discourse-word-cloud/commit/074e0902269e752c11c3c29018f8c68c813327d3
هل نحتاج إلى إلغاء تثبيت الإصدار القديم للحصول على هذا؟
يجب أن تحتاج فقط إلى ترقية البرنامج المساعد. هل تواجه مشاكل؟
نعتذر، لقد وجدنا الحل. ![]()
لا توجد مشكلة على الإطلاق ![]()