المواضيع المقترحة - اقتراحات تستند إلى العنوان والمحتوى

مرحباً،

أنا جديد هنا، لذا آسف إذا كنتُ أكرر ما قيل سابقاً.

أتفق مع @sam بوجود تعقيدات، لكن من ناحية أخرى، أصبحت تقنية نمذجة المواضيع ناضجة جداً، وتوجد أدوات جاهزة ممتازة. لقد حللتُ في مشروع لي حديثاً حوالي 5 ملايين من عناوين و ملخصات براءات الاختراع؛ وتحليل آلاف المواضيع على موقعي الجديد الرائع Discourse سيكون أمراً يسيراً. وعلاوة على ذلك، قد تكون لمجتمعي الطاقة الكافية لجعل ذلك يحدث.

من الخبراء: أود الحصول على نصيحة حول ما إذا كان ينبغي لي التفكير في تصميم إضافة (plugin)، أم أن أفكر في التعديل على مصدر Discourse (الذي قمت بتحميله من GitHub)؟

وجدت هذا الموضوع حول استخراج مواضيع Discourse باستخدام Python، لكنني لم أتمكن من جعله يعمل بعد. شيء مشابه لذلك يجب أن يسمح لي بسحب البيانات خارجاً، وبناء النموذج، ليكون قابلاً للتحميل والاستعلام عنه لاحقاً.

معظم الأدوات الجيدة موجودة في Python، مجرد معلومة جانبية…

4 إعجابات