تمكين ChatBot من قراءة ملفات PDF للمشاركة في نقاش جماعي

بالنسبة لأولئك الذين لديهم إمكانية الوصول إلى أدوات تتيح لهم الدردشة مع ملف PDF واحد أو أكثر، سيكون من الجيد لو تمكن روبوت الذكاء الاصطناعي الخاص بـ Discourse من قراءة ملفات PDF والانضمام إلى المناقشة.


في الوقت الحالي، يستفيد الأكاديميون من هذا الأمر بشكل كبير، لكنني لا أعرف طريقة لمجموعة من المستخدمين للانضمام كمجموعة مع الروبوت لمناقشة الورقة (الأوراق). على حد علمي، يمكن للمرء فقط الدردشة بمفرده مع الروبوت الذي قرأ الورقة. أنا متأكد من وجود محادثات جماعية مع الورقة (الأوراق)، ولكن يجب أن يتوفر ذلك في Discourse أيضًا.

فكر في الأمر كنادي كتاب مع دعوة روبوت، وتكون المناقشة حول ورقة واحدة أو أكثر (ملفات PDF).



إذا خطرت لشخص ما فكرة لامعة :star2: بأن Discourse + مكونات نماذج الذكاء الاصطناعي الإضافية (ref) = :moneybag:، نأمل أن يكون هذا هو المكان الأول الذي تقرأ فيه ذلك.

مع تزايد إنشاء المكونات الإضافية والروبوتات المختلفة، يمكن للمرء في النهاية تشكيل فرقة موسيقية هاوية :guitar:، وعقد لقاء افتراضي للمبرمجين :desktop_computer:، وما إلى ذلك.



3 إعجابات

فيما يتعلق بـ Discourse Chatbot 🤖 نرحب بطلبات السحب (PR).

أي شخص حر في الاتصال بي إذا كان يرغب في رعاية هذا العمل.

الإطار الذي أنشأته قابل للتوسيع بسهولة وستكون قراءة ملفات PDF إضافة رائعة. :+1:

3 إعجابات

سأحتاج إلى شخصيات مخصصة لهذا النوع من العمل، أعتقد أنه يمكن القيام بذلك، تقوم بتقسيم وتضمين ثم يمكنك مناقشته. لكنني لست متأكدًا مما إذا كنت سأخلط هذا مع “مساعد المنتدى”… ربما شخصية “مستكشف المستندات”.

حالة استخدام مثيرة للاهتمام للغاية، ونظرًا لأن لدينا الكثير من البنية التحتية لتحميل المستندات وما إلى ذلك، فليس من الصعب جدًا بناؤه.

3 إعجابات

هل هذا يستخرج النص من الملف ويدخله في الموجه؟ يبدو ميزة مثيرة للاهتمام إذا كان الأمر كذلك.

أولاً، لم أقم بإنشاء أي من هذه، لذا يمكنني فقط التكهن.

نعم.
تحاول العديد من إضافات ChatGPT التي جربتها قراءة ملف PDF بأكمله، ومع ذلك، يقرأ الكثير منها النص فقط، حيث أن محاولة استخراج البيانات من التعبيرات الرياضية والرسوم البيانية تتجاوز قدرتها. هذا يرجع إلى حقيقة أن ملف PDF مصمم للتخطيط والعرض، وليس لاستخراج السياق أو تمرير المعرفة كشكل لتبادل البيانات.

لست متأكدًا تمامًا مما تعنيه بذلك، ولكن حسب فهمي، فإنها تقوم بتضمين المعرفة في قاعدة بيانات متجهة ثم تستخدم الموجه لاختيار الأجزاء ذات الصلة وتكوين رد.
التشبيه الذي أستخدمه لشرح المفهوم للآخرين هو بدلاً من التركيز على فكرة ملف PDF، فكر في الأفكار التي يحاول مؤلف الورقة تمريرها في الورقة وأنك تجري محادثة معهم.

إذا كان بإمكانك تشغيل الإضافات مع ChatGPT، فانتقل إلى هذا الموقع
https://pugin.ai/
ابحث عن PDF أو paper وجرب بعضها. الاختلافان الرئيسيان اللذان أجدهما فيهما هو أن العديد منها سيقرأ ملف PDF واحد (https://pugin.ai/p/chatwithpdf)، بينما سيختار هذا (https://pugin.ai/p/science) الأوراق ذات الصلة من بين 250 مليون ورقة علمية.


يحتوي LangChain على هذا

وهناك مستودعات مماثلة على GitHub (مرجع)، قد تختلف النتائج.


إليك حالة استخدام محددة لهذه التكنولوجيا لأولئك الذين يعتقدون أن مثل هذه التكنولوجيا ستقتصر على الأكاديميين فقط.

الاستفادة من نماذج اللغة الكبيرة مع مجموعات بيانات وأدلة ميكانيكية واسعة

إعجاب واحد (1)

ما مدى غرابة وضع رقم طراز في اسم مستودع! لماذا لن يعمل مع 3.5؟

للعلم

الآخرون يقفزون أيضًا إلى أفكار مماثلة.

إعجاب واحد (1)