أحتاج إلى إعداد تصدير أو نسخة احتياطية يمكنني تحميلها يدويًا إلى مساحة عمل Perplexity.ai. أريد تضمين جميع المشاركات في الموقع بأكمله. أنواع الملفات المسموح بها هي:
.json
.md
.txt
.pdf
.csv
.xlsx
.docx
.pptx
يمكنني تحميل ما يصل إلى 50 ملفًا بحجم 25 ميجابايت أو أقل.
لا أحتاج إلى تضمين الصور.
ما هي أفضل طريقة؟
(أيضًا، ليس ضروريًا، ولكن إذا أمكن، أود أن تتضمن الملفات المصدرة محتويات المستندات التي تم تحميلها بواسطة المستخدم مثل ملفات .pdf بتنسيق يمكن قراءته بواسطة نماذج اللغة الكبيرة.)
هل لدى أي شخص أي أفكار حول أفضل طريقة لإعداد مثل هذا التصدير؟
أنا أستضيف بنفسي.
إليك ما وجدته حتى الآن …
قال Ask.Discourse.com...
تصدير المحتوى مع استبعاد الصور:
- استخدام إضافة مستكشف البيانات (إذا كانت متاحة):
- تسمح إضافة مستكشف البيانات الخاصة بـ Discourse لك بتشغيل استعلامات SQL مخصصة لاستخراج أنواع مختلفة من البيانات بالتنسيق الذي تريده (مثل
JSON،CSV). - مثال على الاستعلام: قم بتشغيل استعلام لتصدير جميع المشاركات والمواضيع. سيعطيك هذا بيانات منظمة.
- تسمح إضافة مستكشف البيانات الخاصة بـ Discourse لك بتشغيل استعلامات SQL مخصصة لاستخراج أنواع مختلفة من البيانات بالتنسيق الذي تريده (مثل
- تصدير JSON عبر واجهة برمجة التطبيقات (API):
- يمكن تصدير كل موضوع أو مشاركة على Discourse برمجيًا بتنسيق
JSONعن طريق إضافة.jsonإلى عنوان URL الخاص بها. - على سبيل المثال:
- يمكن تصدير كل موضوع أو مشاركة على Discourse برمجيًا بتنسيق
https://<your-discourse-site>/t/topic-title/<topic-id>.json
* إذا كنت تهدف إلى تشغيل هذه التصديرات برمجيًا لجميع المواضيع على الموقع بناءً على معرفات المواضيع، فسيؤدي ذلك إلى الحصول على المحادثات في ملفات `.json` فردية.
- خيار سطر الأوامر الآلي (إذا كان مدعومًا):
- بالنسبة للمواقع المستضافة ذاتيًا، يمكن للمستخدمين المتقدمين العمل مباشرة مع قاعدة البيانات باستخدام أوامر
pg_dumpأو خطوات استخراج استعلامات قاعدة البيانات المماثلة. - ومع ذلك، فإن الخطط المستضافة لا تسمح بتشغيل هذه الأدوات مباشرة.
- بالنسبة للمواقع المستضافة ذاتيًا، يمكن للمستخدمين المتقدمين العمل مباشرة مع قاعدة البيانات باستخدام أوامر
- المستندات التي تم تحميلها بواسطة المستخدم (مثل ملفات PDF):
- للأسف، دمج محتويات المستندات المحملة مباشرة في
.jsonأو أي تنسيق إخراج آخر مثل.txtغير مدعوم بشكل أصلي. ومع ذلك، يمكنك تنزيل المستندات وتحليلها بشكل منفصل محليًا باستخدام أدوات متخصصة لتضمين نصوصها في تنسيقات منظمة.
- للأسف، دمج محتويات المستندات المحملة مباشرة في
توصية نوع الملف:
بالنظر إلى قيود التحميل الخاصة بك:
- لاستخراج النص، قم بتصدير ملفات
.jsonأو.csv، حيث يمكن لهذه التنسيقات التقاط تفاصيل المشاركات والمواضيع المنظمة بشكل أفضل.
إذا كنت بحاجة إلى تخصيص إضافي، فيرجى إخباري!
لمزيد من التفاصيل، تحقق من وثائق إضافة مستكشف البيانات.