يشرح هذا الدليل كيفية تطبيق واستخدام إمكانيات معالجة ملفات PDF داخل discourse-ai، بما في ذلك استخراج النص الأساسي والمعالجة المحسّنة بمساعدة النماذج اللغوية الكبيرة (LLM).
مستوى المستخدم المطلوب: مسؤول
الملخص
تدعم إضافة discourse-ai معالجة ملفات PDF لـ RAG (التوليد المعزز بالاسترجاع) في وضعين متميزين:
استخراج النص الأساسي
المعالجة المحسّنة بتحليل النماذج اللغوية الكبيرة (LLM)
استخراج النص الأساسي
يوفر هذا الوضع إمكانيات أساسية لمعالجة ملفات PDF:
يستخرج محتوى النص باستخدام حزمة pdf-reader
يدعم الملفات التي يصل حجمها إلى 100 ميجابايت
يعمل فور تثبيت الإضافة
يعالج المحتوى النصي فقط (يتجاهل العناصر المرئية)
المعالجة المحسّنة بتحسينات النماذج اللغوية الكبيرة (LLM)
يتطلب هذا الوضع إعدادات محددة ويوفر إمكانيات أكثر تقدمًا.
المتطلبات:
اشتراك في خطة المؤسسات (Enterprise) أو استضافة Discourse ذاتية
تثبيت ImageMagick مع دعم Ghostscript في الحاوية
تفعيل إعداد الموقع ai_rag_images_enabled
القدرات:
تفسير الصور والرسوم البيانية والمخططات
توفير سياق من العناصر المرئية
معالجة ملفات PDF صفحة بصفحة
الحفاظ على حد حجم الملف البالغ 100 ميجابايت
تفاصيل التنفيذ
مواصفات المعالجة
دقة معالجة الصفحة: 300 نقطة في البوصة (DPI)
أقصى وقت للمعالجة: 600 ثانية (10 دقائق)
التنظيف التلقائي للملفات المؤقتة
تكامل كامل مع تضمينات مستندات RAG
سير عمل المعالجة
تحميل ملف PDF والتحقق من صحته
استخراج المحتوى (الوضع الأساسي أو المحسّن)
تقسيم النص مع تداخل قابل للتهيئة
تضمين الأجزاء وتخزينها
تتبع التقدم عبر MessageBus
القيود
كن على دراية بهذه القيود عند تطبيق معالجة ملفات PDF:
قيود حجم الملف:
100 ميجابايت لمعالجة ملفات PDF الحالية
20 ميجابايت لتحميلات واجهة المسؤول الجديدة
يتطلب الوضع المحسّن موارد نظام إضافية
قد لا يتم تفسير تخطيطات ملفات PDF المعقدة بشكل مثالي
أيضًا، هل هناك أي خطة للسماح بإجراء RAG “الدردشة مع ملفات PDF الخاصة بك” عن طريق تحميل ملفات PDF في رسالة خاصة روبوت ذكاء اصطناعي أو في موضوع/منشور وذكر الروبوت؟
In my website (Arabic Forum) I did a test in Arabic by adding legislation in the first post “topic” and then I asked questions using AI, but the answers not accurate and I think this is because it is not Context Ragging
أولاً وقبل كل شيء، شكراً جزيلاً على عملكم الرائع. أنا معجب به حقًا.
بعد التجربة مع الإعدادات وتغيير نموذج الذكاء الاصطناعي إلى Gemini-Flash-2.0، لقد عمل بشكل رائع بالنسبة لي. إليك الوضع الذي لدي:
نحن مجتمع من المدققين والمحاسبين ومستشاري الضرائب، وكنا بحاجة إلى أداة لمشاركة القوانين ذات الصلة وإثارة المناقشات حولها. يجب أن تكون هذه المناقشة مفيدة جدًا للزوار، حيث أننا محترفون في مجالنا. نحن نستهدف نموذج الذكاء الاصطناعي لفحص التشريعات وتحليلها والإجابة على أسئلتنا. أدت التجربة الرائعة إلى استنتاج مفاده أنه يمكننا حقًا مناقشة السياق المضاف في المنشور الأول، وإذا كان نموذج الذكاء الاصطناعي ذكيًا بما يكفي، فسوف يجيب على أسئلتنا بمخرجات عالية الجودة للغاية.
شكرًا جزيلاً مرة أخرى ونتطلع إلى دعم PDF لأنه سيجعل Discourse أفضل برنامج للمنتديات.
هل يجب تمكينه عبر وحدة التحكم؟ لا أرى أي خيارات للوضع المتقدم عبر واجهة المستخدم.
علاوة على ذلك، أحصل على خطأ عند محاولة تحميل ملف PDF هذا. حجمه 34 ميجابايت ولكن لدي الحد الأقصى لحجم المرفقات المحدد بـ 100 ميجابايت (في كل من إعدادات المسؤول و app.yml). الغريب هو أن لدي نسخة مضغوطة حجمها 16 ميجابايت وتقوم بالتحميل بشكل جيد. ولكن ربما يكون ملف PDF الأكبر معقدًا جدًا في الوقت الحالي؟ هناك الكثير من الصور والمعادلات وما إلى ذلك.
أتلقى هذا الخطأ عند مطالبة الروبوت بتلخيص محتويات بعض ملفات PDF على موقعي. لم أقم بتمكين المعالجة المحسّنة، وأستخدم GPT 4.1. أي أفكار حول ما أفعله بشكل خاطئ؟
عذرًا، يبدو أن نظامنا واجه مشكلة غير متوقعة أثناء محاولة الرد.
تفاصيل الخطأ
{
“error”: {
“message”: “يجب أن يتبع رسالة المساعد التي تحتوي على ‘tool_calls’ رسائل أدوات تستجيب لكل ‘tool_call_id’. لم يكن لـ tool_call_ids التالية رسائل استجابة: call_nrDCba5mt83oavbXfPq2BtEV”,
“type”: “invalid_request_error”,
“param”: “messages.[2].role”,
“code”: null
}
}
هل هناك أي تحديثات بخصوص هذا الأمر؟ أنا أرفق ملف PDF عند بدء محادثة مع الذكاء الاصطناعي، ولكنه لا يزال لا يتعرف عليه على ما يبدو. أنا أستخدم حاليًا GPT. هل يجب عليّ ربما التفكير في استخدام نموذج مختلف مصمم خصيصًا لمعالجة ملفات PDF؟