لكننا نبحث عن طريقة لإجراء معالجة اللغة الطبيعية (NLP) على جميع المحادثات في موقع Discourse الخاص بنا. سأل أحد أعضاء فريقنا عما إذا كان يمكن القيام بذلك من خلال العمل على مستوى منخفض في الخلفية، مثل تصدير قاعدة البيانات ولكن بدون الجداول، باستخدام أمر مثل pg_dump --schema-only. لم أفهم تمامًا ما يقصده زميلي، لكنني اعتقدت أنك قد تفهم.
لذا قمت بتثبيت الإضافة واستعرضت جميع الاستعلامات المنفذة في (Superseded) What cool data explorer queries have you come up with? لكن لا يوجد أي منها قادر على تصدير المحادثات الفعلية. على سبيل المثال، طلبت 100 موضوع نشط رئيسي. حصلت على إدخالات قاعدة بيانات تحتوي على معرفات المواضيع (انظر لقطة الشاشة)، لكن لا توجد محادثات. هل هذا لأن الإضافة مخصصة فقط لاستخراج البيانات من قاعدة البيانات ولا تقوم بسحب المحادثات نفسها؟ إذا كان ذلك صحيحًا، فهل توجد طريقة لاستخدام المعلومات المستخرجة من قاعدة البيانات لاستخراج المحادثات في ملفات JSON، حيث تكون معرفات المواضيع هي تلك المستخرجة من قاعدة البيانات بواسطة الإضافة؟
لم أفهم خيارك الأول، ربما هناك خطأ مطبعي في نصك؟ هل تقصد أنني أحصل فقط على المنشور الأول للموضوع؟
بخصوص الخيار الثاني مع الامتداد .json، هل هناك عنوان URL بديل يستخدم معرف الموضوع (topic_id) أو أي إدخال آخر يمكن استخدامه للحصول على طريقة أكثر برمجية لاستلام المحادثة بتنسيق JSON دون الحاجة إلى معرفة عنوان الموضوع؟