تفريغ جميع المحادثات في ملف وبيانات منظمة

هذا السؤال مشابه لهذا: Does Discourse support export conversations as an organized bulk of data?

لكننا نبحث عن طريقة لإجراء معالجة اللغة الطبيعية (NLP) على جميع المحادثات في موقع Discourse الخاص بنا. سأل أحد أعضاء فريقنا عما إذا كان يمكن القيام بذلك من خلال العمل على مستوى منخفض في الخلفية، مثل تصدير قاعدة البيانات ولكن بدون الجداول، باستخدام أمر مثل pg_dump --schema-only. لم أفهم تمامًا ما يقصده زميلي، لكنني اعتقدت أنك قد تفهم.

إذا كنت تستضيف بنفسك، فيمكنهم تنفيذ أمر pg_dump الذي يعتقدون أنه سيساعدهم.

يمكنك أيضًا تصدير البيانات بتنسيقات مختلفة باستخدام إضافة مستكشف البيانات.

يبدو أن هذه الإضافة توفر معظم ما نبحث عنه! شكرًا لك!

لذا قمت بتثبيت الإضافة واستعرضت جميع الاستعلامات المنفذة في (Superseded) What cool data explorer queries have you come up with? لكن لا يوجد أي منها قادر على تصدير المحادثات الفعلية. على سبيل المثال، طلبت 100 موضوع نشط رئيسي. حصلت على إدخالات قاعدة بيانات تحتوي على معرفات المواضيع (انظر لقطة الشاشة)، لكن لا توجد محادثات. هل هذا لأن الإضافة مخصصة فقط لاستخراج البيانات من قاعدة البيانات ولا تقوم بسحب المحادثات نفسها؟ إذا كان ذلك صحيحًا، فهل توجد طريقة لاستخدام المعلومات المستخرجة من قاعدة البيانات لاستخراج المحادثات في ملفات JSON، حيث تكون معرفات المواضيع هي تلك المستخرجة من قاعدة البيانات بواسطة الإضافة؟

 SELECT * FROM posts where topic_id=425

هذا سيعطيك منشورات أول موضوع في استعلامك (بافتراض أنني أستطيع الكتابة على هذا الهاتف).

ولكن إذا كنت تريد JSON، فيمكنك فعل شيء مثل

  https://meta.discourse.org/t/dump-all-conversations-in-a-file-and-structured-data/202351.json

لم أفهم خيارك الأول، ربما هناك خطأ مطبعي في نصك؟ هل تقصد أنني أحصل فقط على المنشور الأول للموضوع؟

بخصوص الخيار الثاني مع الامتداد .json، هل هناك عنوان URL بديل يستخدم معرف الموضوع (topic_id) أو أي إدخال آخر يمكن استخدامه للحصول على طريقة أكثر برمجية لاستلام المحادثة بتنسيق JSON دون الحاجة إلى معرفة عنوان الموضوع؟

هل جربت استعلام SQL؟ هل كان هناك خطأ؟ تعديل: لقد تحققت. سيعيد هذا الاستعلام جميع المنشورات في موضوع معين.

يمكنك الحصول على أي موضوع باستخدام معرف الموضوع فقط.

https://meta.discourse.org/t/-/202351.json

كان الاستعلام سليمًا، لقد أسأت فهم شرحك لما يوفره فعليًا. شكرًا لك على التحقق مرة أخرى. هذه حلول رائعة.