علامة موضوع تلقائية باستخدام تعلم الآلة؟

أنا خبير في تعلم الآلة، لكن ليس لدي خبرة في نظام Discourse. ومع ذلك، لقد استخدمت Discourse بكثرة واستمتعت به حقًا.

أعتقد أن أداة ستكون قوية جدًا لو كانت سكريبتًا يُنفذ (يتفاعل مع واجهة برمجة التطبيقات) ويمكنه:

  1. فحص استخدام الوسوم (Tags)، وتحديد الوسوم تلقائيًا للمواضيع بناءً على البيانات. على سبيل المثال، إذا كان وسم “وصفة” مستخدمًا وبعض المواضيع موسومة بـ “وصفة”، فيمكن لخوارزمية تعلم الآلة تحديد منشورات إضافية يجب وسمها بـ “وصفة”.

  2. فحص المواضيع لاقتراح وسوم جديدة، وتحديد المواضيع ذات الصلة تلقائيًا.

أعتقد أن التنفيذ الصحيح لهذا سيكون بلغة بايثون، وخارج تنفيذ Discourse الفعلي. ومع تصميم برمجي جيد، سيتم فصل معالجة اللغة الطبيعية (NLP) وتعلم الآلة (ML) عن الكود الذي يتفاعل مع Discourse. من خلال التفاعل مع Discourse عبر واجهة برمجة التطبيقات، سيُتاح تطوير كود تعلم الآلة بشكل مرن، وتطوير حزمة بايثون مفتوحة المصدر تساهم فيها مجتمع تعلم الآلة بشكل مستقل تقريبًا عن توزيع Discourse. وقد يتيح واجهة قوية أيضًا تطبيق تعلم الآلة على إدارة منتديات Discourse بطرق أخرى.

لذلك، أنا مهتم بتطوير نسخة أولية من معالجة اللغة الطبيعية وتعلم الآلة لتنفيذ أداة تحديد الوسوم التلقائي، وجعلها مكتبة مفتوحة المصدر.

هل هناك مطورو Discourse على دراية بواجهة برمجة التطبيقات مهتمون بالمساعدة في مكون التواصل مع Discourse لهذا المشروع/المكتبة؟ هذا مكون حاسم في الفريق ناقص حاليًا. نحتاج إلى شخص قادر على القيام بذلك قبل أن نتمكن من البدء.

هل هناك أكاديميون/خبراء آخرون يرغبون في المشاركة في تطوير معالجة اللغة الطبيعية وتعلم الآلة؟

ربما لدى @samamorgan أو @black بعض الاقتراحات أو قد يشاركون؟

أوصي بالاعتماد على الويب هوكس هنا، حيث يمكنك استهلاك الويب هوك من تطبيق بايثون الخاص بك والرد عليه باستخدام واجهة برمجة التطبيقات الخاصة بنا.

نود أن نرى مدى نجاح ذلك.

من المجالات الأخرى المثيرة للاهتمام استخدام word2vec أو أي نوع من تحويل الجمل إلى متجهات لتحديد تشابه المواضيع في Support … فكثير من الأسئلة تُطرح مرارًا وتكرارًا بطرق مختلفة، ودمج المعلومات معًا يمكن أن يكون مفيدًا جدًا.

في الوقت الحالي، أعتقد أن Neo4j قد يكون الخيار الأنسب…

سأقوم أيضًا بالبحث في موضوع الويب هوكس…

@swamidass يبدو أن المشروع مثير للاهتمام! سأكون سعيدًا بالمشاركة والمساعدة إذا كان مفتوح المصدر.

@samamorgan، هل يمكنك كتابة كود واجهة لاستيراد معلومات Discourse إلى Neo4j (باستخدام واجهة برمجة التطبيقات)؟ اتضح أن هذا يمكن إنجازه دون الحاجة إلى أي كود بلغة بايثون، حيث توفر Neo4j واجهة للقيام بذلك. راجع الأمثلة الخاصة بـ Twitter و StackExchange:

هذا الرابط ذو صلة أيضًا:

https://neo4j.com/developer/guide-import-json-rest-api/

إذا كانت لديك فكرة لمشروع، ابدأ مستودع git وحدد العملية. يسعدني الانضمام والمساهمة حسب ما يتاح من وقت إذا قمت بوضع الرابط هنا.

شكرًا لك. إليك مستودع Git.