التعرف التلقائي على النص في الصورة للنص البديل

على الرغم من أن Discourse تتميز بميزة أنيقة لتعديل أوصاف الصور النصية البديلة في جزء المعاينة (لأولئك الذين يخشون تعديل Markdown)، إلا أنه في مجتمعنا الذي يضم أكثر من 1800 عضو، لا يكاد أحد يكتب نصًا بديلاً. اسم الملف عديم الفائدة تمامًا في رأيي..

أعلم أن هناك أملًا/إمكانية للذكاء الاصطناعي للقيام بالقطع الأول، ويمكنني رؤية ذلك كحد أدنى، وأفضل النص البديل الذي كتبه الإنسان ليقرأه البشر الآخرون الذين يعانون من ضعف البصر. هذا لا “يحل” المشكلة، ولكني أتساءل عن القدرة التي أراها في Mastodon لوجود خيار للتعرف الضوئي على الحروف (OCR) للنص من صورة وإدراجه في جزء التحرير.

هنا قمت بتحميل صورة في Mastodon تحتوي على نص، وأنا أستعد لكتابة النص البديل الخاص بي.

عندما أنقر على اكتشاف النص من الصورة، يستغرق الأمر ثوانٍ فقط لملء حقل إدخال النص:

قد تكون هناك حاجة إلى تعديلات طفيفة، لكنها توفر الكثير من الوقت. وهي أفضل من قارئ الشاشة الذي يواجه هذا ويتحدث “Screen Shot 59.jpg”.

5 إعجابات

شكرًا!

تمت الإشارة إلى طلب الميزة هذا في منتدى OpenAI Discourse.

إعجابَين (2)

نحن نعمل على ميزة ستستخدم الذكاء الاصطناعي لإنشاء أوصاف نصية للصور، لذلك سنتجاوز خطوة التعرف الضوئي على الحروف (OCR) في الوقت الحالي. سنعلن عنها على ميتا (Meta) بمجرد توفرها!

7 إعجابات

التسمية التوضيحية متاحة الآن كخيار في المكون الإضافي للذكاء الاصطناعي: AI Image Captioning Feature in Discourse AI Plugin - #6

تجدر الإشارة أيضًا إلى أن هذا ليس بديلاً حقيقيًا عن التعرف الضوئي على الحروف (OCR):

إعجابَين (2)