تمكين ChatBot من قراءة ملفات PDF للمشاركة في نقاش جماعي

EricGT · 29 أغسطس 2023، 12:47م

بالنسبة لأولئك الذين لديهم إمكانية الوصول إلى أدوات تتيح لهم الدردشة مع ملف PDF واحد أو أكثر، سيكون من الجيد لو تمكن روبوت الذكاء الاصطناعي الخاص بـ Discourse من قراءة ملفات PDF والانضمام إلى المناقشة.

في الوقت الحالي، يستفيد الأكاديميون من هذا الأمر بشكل كبير، لكنني لا أعرف طريقة لمجموعة من المستخدمين للانضمام كمجموعة مع الروبوت لمناقشة الورقة (الأوراق). على حد علمي، يمكن للمرء فقط الدردشة بمفرده مع الروبوت الذي قرأ الورقة. أنا متأكد من وجود محادثات جماعية مع الورقة (الأوراق)، ولكن يجب أن يتوفر ذلك في Discourse أيضًا.

فكر في الأمر كنادي كتاب مع دعوة روبوت، وتكون المناقشة حول ورقة واحدة أو أكثر (ملفات PDF).

إذا خطرت لشخص ما فكرة لامعة بأن Discourse + مكونات نماذج الذكاء الاصطناعي الإضافية (ref) = ، نأمل أن يكون هذا هو المكان الأول الذي تقرأ فيه ذلك.

مع تزايد إنشاء المكونات الإضافية والروبوتات المختلفة، يمكن للمرء في النهاية تشكيل فرقة موسيقية هاوية ، وعقد لقاء افتراضي للمبرمجين ، وما إلى ذلك.

merefield · 29 أغسطس 2023، 2:47م

فيما يتعلق بـ Discourse Chatbot 🤖 نرحب بطلبات السحب (PR).

أي شخص حر في الاتصال بي إذا كان يرغب في رعاية هذا العمل.

الإطار الذي أنشأته قابل للتوسيع بسهولة وستكون قراءة ملفات PDF إضافة رائعة.

sam · 31 أغسطس 2023، 12:39ص

سأحتاج إلى شخصيات مخصصة لهذا النوع من العمل، أعتقد أنه يمكن القيام بذلك، تقوم بتقسيم وتضمين ثم يمكنك مناقشته. لكنني لست متأكدًا مما إذا كنت سأخلط هذا مع “مساعد المنتدى”… ربما شخصية “مستكشف المستندات”.

حالة استخدام مثيرة للاهتمام للغاية، ونظرًا لأن لدينا الكثير من البنية التحتية لتحميل المستندات وما إلى ذلك، فليس من الصعب جدًا بناؤه.

Falco · 31 أغسطس 2023، 1:46م

هل هذا يستخرج النص من الملف ويدخله في الموجه؟ يبدو ميزة مثيرة للاهتمام إذا كان الأمر كذلك.

EricGT · 31 أغسطس 2023، 2:05م

أولاً، لم أقم بإنشاء أي من هذه، لذا يمكنني فقط التكهن.

نعم.
تحاول العديد من إضافات ChatGPT التي جربتها قراءة ملف PDF بأكمله، ومع ذلك، يقرأ الكثير منها النص فقط، حيث أن محاولة استخراج البيانات من التعبيرات الرياضية والرسوم البيانية تتجاوز قدرتها. هذا يرجع إلى حقيقة أن ملف PDF مصمم للتخطيط والعرض، وليس لاستخراج السياق أو تمرير المعرفة كشكل لتبادل البيانات.

لست متأكدًا تمامًا مما تعنيه بذلك، ولكن حسب فهمي، فإنها تقوم بتضمين المعرفة في قاعدة بيانات متجهة ثم تستخدم الموجه لاختيار الأجزاء ذات الصلة وتكوين رد.
التشبيه الذي أستخدمه لشرح المفهوم للآخرين هو بدلاً من التركيز على فكرة ملف PDF، فكر في الأفكار التي يحاول مؤلف الورقة تمريرها في الورقة وأنك تجري محادثة معهم.

إذا كان بإمكانك تشغيل الإضافات مع ChatGPT، فانتقل إلى هذا الموقع
https://pugin.ai/
ابحث عن PDF أو paper وجرب بعضها. الاختلافان الرئيسيان اللذان أجدهما فيهما هو أن العديد منها سيقرأ ملف PDF واحد (https://pugin.ai/p/chatwithpdf)، بينما سيختار هذا (https://pugin.ai/p/science) الأوراق ذات الصلة من بين 250 مليون ورقة علمية.

يحتوي LangChain على هذا

وهناك مستودعات مماثلة على GitHub (مرجع)، قد تختلف النتائج.

إليك حالة استخدام محددة لهذه التكنولوجيا لأولئك الذين يعتقدون أن مثل هذه التكنولوجيا ستقتصر على الأكاديميين فقط.

الاستفادة من نماذج اللغة الكبيرة مع مجموعات بيانات وأدلة ميكانيكية واسعة

merefield · 31 أغسطس 2023، 3:12م

ما مدى غرابة وضع رقم طراز في اسم مستودع! لماذا لن يعمل مع 3.5؟

EricGT · 12 أكتوبر 2023، 10:21م

للعلم

الآخرون يقفزون أيضًا إلى أفكار مماثلة.

الموضوع		الردود	مرات العرض
Using PDF and attachment support with AI bots Site Management how-to , ai , ai-bot	0	346	11 ديسمبر 2025
PDF support in Discourse AI (RAG) Site Management how-to , ai	20	1093	5 ديسمبر 2025
Native PDF and attachment support in Discourse AI Announcements ai	0	124	11 ديسمبر 2025
Will RAG Support PDF Files in the Future? Feature completed , ai , ai-bot	21	783	11 مارس 2025
[Ai Bot] Add user token tracking, custom AI personas, max context posts, document loading, custom API URLs, and localized chat titles Feature ai , ai-bot	1	616	22 مارس 2024

تمكين ChatBot من قراءة ملفات PDF للمشاركة في نقاش جماعي

الموضوعات ذات الصلة