سيكون هذا تحسينًا ضخمًا ، خاصة بالنسبة للمنتديات التي تحمل الكثير من الوثائق عبر ملفات PDF أو المسح الضوئي أو الصور. إذا كان نطاق هذا يقتصر على البحث ، فمن المثالي أن تحتاج فقط إلى استخراج / إنشاء نص ثم تخزين هذا النص في عمود في postgres. عند القيام بذلك ، يمكنك الاستفادة من النص الكامل لـ postgres الموجود بالفعل.
في لينكس على سبيل المثال ، يمكنك استخدام pdftotext لاستخراج النص من ملف PDF وتخزينه في قاعدة البيانات. فكرة أخرى (أكثر تكلفة) هي استخدام رؤية الذكاء الاصطناعي لشرح / استخراج ملف PDF أو الصورة للتخزين في قاعدة البيانات.
أفكار؟