يمكن للأشخاص نشر لقطات شاشة، هل يمكن أن تكون هناك طريقة لاستخراج النص من صورة، وإضافته في أسفل المنشور
بالتأكيد. Google OCR.
ولكن ليس بواسطة Discourse. وأعتقد أن مثل هذه الوظيفة لن تأتي قريبًا على أي حال ![]()
تشتبه في أنك ستحتاج إلى إنشاء إضافة إما عن طريق تأليفها بنفسك أو الاستعانة بمستقل Marketplace
انظر هذه الإضافة
العميل (@csmu) لم يدفع لي قط بالمناسبة ![]()
مرحباً @michaeld
بالاطلاع السريع على هذه الإضافة، هل أنا على حق في أن الصور تُرسل إلى خوادم جوجل للمعالجة؟ ما هو المنطق وراء هذا النهج بدلاً من استخدام جوهرة روبي للمعالجة محليًا أو على خادم مثيل ديسكورس؟ أنا مهتم بهذا الموضوع، لكن إرسال الصور إلى جهة خارجية ليس خيارًا.
أداء أفضل، سهولة الصيانة، تجنب تبعيات الإصدارات على التثبيت المحلي.
أتفهم أن هذا ليس دائمًا نهجًا مقبولًا. نرحب بطلب سحب (PR) على الرغم من أنه يجب أن يكون المستخدم دائمًا قادرًا على تجنب جحيم التبعيات المحلية.
مثير للاهتمام. أعتقد أن هذا كان يركز في الغالب على الكتابة اليدوية، أليس كذلك؟ إذا كان الأمر يتعلق ببساطة باستخراج نص من صورة، على سبيل المثال لقطة شاشة لخطأ، فأعتقد أن مكتبة محلية قد تكون دقيقة بما فيه الكفاية. لقد لعبت بمكتبة بايثون لشيء كهذا منذ فترة وحصلت على نتائج معقولة. في بعض الأحيان كانت القمامة، ولكن النتائج لن يقرأها المجتمع أبدًا، فقط محرك البحث. إذا لاحظ المستخدم شيئًا سخيفًا، فيمكنه دائمًا تعديل النص المخفي.
لا أريد نتائج معقولة، أريد نتائج ممتازة.
لا يوجد تعرف ضوئي على الحروف (OCR) يمكنه تقديم نتائج ممتازة. حتى النتائج المعقولة قد يكون من الصعب تحقيقها - بغض النظر عن المكتبة المستخدمة،
ضع في اعتبارك أن التعرف الضوئي على الحروف غالبًا ما يعمل على لقطات الشاشة، وليس على المسح الضوئي أو الصور. لن يكون مثاليًا بنسبة 100%، ولكنه نوع جيد من النصوص لمحاولة التعرف عليه.
ألاحظ أن واجهة الويب الخاصة بـ Mastodon تقدم وظيفة التعرف الضوئي على الحروف في مربع الحوار حيث يمكنك إدخال وصف للصورة لأسباب تتعلق بإمكانية الوصول. قد يكون ذلك يعمل من جانب الخادم. إليك كيف يبدو الأمر، بعد أن نقرت على “اكتشاف النص من الصورة”:
مثير للاهتمام. يبدو أنه يعطي نتائج مماثلة لـ Tesseract. أتساءل كيف تتعامل أداة Mastodon مع الصور التي تحتوي على رسومات بالإضافة إلى النصوص؟
هدف نبيل
بينما أشارك الرغبة في الحصول على نتائج ممتازة، سأكون سعيدًا بتحسن بنسبة 80٪ ؛)
في السياق الذي أفكر فيه، الهدف هو استخراج أشياء مثل رسائل الخطأ من لقطات الشاشة. على سبيل المثال، إذا كان لدى المستخدم سجل أخطاء في جهازه الطرفي، فإن الميل هو مجرد التقاط صورة له. حتى لو لم تكن النتيجة مثالية، إذا استخرجت حوالي 80٪ من النص بشكل صحيح، فإن شخصًا يبحث عن رسالة الخطأ، أو قطعة نص أخرى ذات صلة لديه فرصة أكبر للعثور على الموضوع، مما لو كانت مجرد صورة غير قابلة للبحث.
