أود اقتراح ميزة جديدة ستحدث فرقًا كبيرًا في إمكانية الوصول والمشاركة في منصة Discourse: الدعم الأصلي لتسجيل ونشر الرسائل الصوتية مباشرة في المواضيع والردود، مع النسخ التلقائي للصوت إلى نص (على غرار ما تقدمه Instagram و WhatsApp). لقد رأيت بعض المناقشات حول المكونات الإضافية والمكونات لهذه الإمكانية، بما في ذلك المعلومات التي تفيد بأن المكون المتاح لا يعمل الآن. نظرًا لعدم امتلاكي الخبرة الكافية لتثبيت مكون إضافي من GitHub بنفسي وتجربته، فإن أداة أصلية مدمجة في النظام مع مجرد تبديل تمكين/تعطيل ستكون رائعة للمستخدمين العاديين مثلي =)
لماذا هذه الميزة؟
بالنسبة للكثيرين، الكتابة ليست دائمًا الوسيلة الأكثر فعالية أو سهولة للتواصل. قد يشمل ذلك:
الأشخاص ذوو الإعاقة أو الإصابات المؤقتة التي تجعل الكتابة صعبة.
أعضاء المجتمع الذين يفضلون التحدث بسبب مستويات الإلمام بالقراءة والكتابة أو الراحة.
المستخدمون على الأجهزة المحمولة الذين يريدون اتصالًا أسرع وبدون استخدام اليدين.
السماح للمستخدمين بتسجيل ونشر الصوت (ملاحظات صوتية) بما في ذلك في التعليقات مباشرة سيقلل بشكل كبير من حواجز المشاركة ويجعل مجتمعات Discourse أكثر شمولاً.
لماذا النسخ مهم؟
سيضمن النسخ التلقائي للرسائل الصوتية أن يتمكن جميع المستخدمين - بما في ذلك أولئك الذين لا يستطيعون الاستماع إلى الصوت (على سبيل المثال، بسبب ضعف السمع أو عندما يكونون في بيئة هادئة) - من المشاركة والتفاعل بشكل كامل مع المحتوى على المنصة.
دمج هذا بشكل أصلي (كما تفعل Instagram و WhatsApp و Google Messages)، سيجعل منصات Discourse أقرب إلى معايير الشمولية وإمكانية الوصول الحديثة.
ومع ذلك، فإن معظم هذه المكونات إما لا تتم صيانتها بنشاط، أو ليست مدمجة بالكامل، أو تفتقر إلى ميزات النسخ. هناك اهتمام مستمر وواضح من المجتمع فيما يتعلق بالميزات الصوتية وتكامل الصوت إلى نص.
الوظائف المقترحة
السماح بالتسجيل المباشر للصوت (ملاحظات صوتية) في المنشئ للمواضيع والردود.
دعم تحميل الملفات الصوتية كبديل.
التكامل مع خدمة تحويل الكلام إلى نص لإنشاء وعرض نسخة تلقائية مع كل منشور صوتي.
خيار لتحرير أو تصحيح النسخ قبل النشر.
ضوابط إشراف لإدارة ومراجعة المحتوى الصوتي.
ختام
ستجعل هذه الميزة Discourse منصة شاملة وحديثة تميزها عن غيرها، تدعم مجموعة متنوعة من المستخدمين والمواقف.
شكراً لكم على النظر في هذا الأمر! سأكون (وغيري في المجتمع) متحمسين حقًا لرؤية أي تقدم في هذا الاتجاه.
أود ذلك شخصيًا. لقد كسرت يدي العام الماضي وبينما يعمل إملاء Apple بشكل جيد جدًا، كنت أود أن أتمكن من القيام بذلك مباشرة في Discourse أيضًا. ومع ذلك، شخصيًا، أميل إلى الإطالة عند الإملاء! :ضحك:
أود ذلك أيضًا لمنتدي عائلتي حيث نشارك الصور ونتحدث عنها، من بين أشياء أخرى. القدرة على تسجيل رسالة بحيث يتم التقاط الصوت ثم تحويله إلى نص سيكون أمرًا رائعًا للغاية.
يبدو هذا وكأنه شيء يجب التعامل معه من جانب الكمبيوتر. تعلم استخدام نظام إملاء واحد وجعله يعمل يبدو صعبًا بما فيه الكفاية. وجود نظام مختلف على كل قطعة من البرامج التي تستخدمها يبدو أنه سيكون مروعًا. محاولة دعم الإملاء على منصات متعددة من خلال المتصفح تبدو أيضًا غير قابلة للتطبيق.
ألن تفضل أن ترى أن تحويل الصوت إلى نص يعمل بالفعل قبل تحميله إلى منتدى؟ ألا يعمل تحويل الصوت إلى نص بشكل أفضل على جهاز الكمبيوتر الخاص بك حيث يمكن تدريبه على صوتك الخاص؟
أنا مع دعم جميع أنواع المستخدمين، لكنني لا أرى كيف يكون من المنطقي أن يكون كل تطبيق ويب مسؤولاً عن النسخ. لا نتوقع من Discourse قراءة النص للمكفوفين، بل يوفر Discourse HTML الذي يمكن للتطبيق الذي يختاره المستخدم العمل معه.
إمكانية الوصول هي حالة استخدام واحدة (ربما الحالة الرئيسية) ولكنها ليست الوحيدة.
نظرًا لأن المنتدى يهدف إلى تسهيل التفاعلات الهادفة وبناء المجتمع، فإن تقديم أكثر من طريقة لمشاركة فكرة يبدو ذا قيمة. لا أعرف مدى تعقيد هذا من منظور التطوير، أو ما إذا كان الأمر يستحق الجهد، لكنني أستمر في التفكير في مدى سهولة تعبير الأشخاص عن أنفسهم في مجموعات واتساب ببساطة لأن خيار تسجيل ملاحظة صوتية موجود هناك. سيكون من الرائع أن يكون لدينا شيء مشابه في المنتدى، حيث يمكن تنظيم المحادثات بشكل أفضل حسب الموضوعات والفئات.
أنا نفسي غالبًا ما أستخدم ميزة إنستغرام التي تنسخ الملاحظات الصوتية بدلاً من تشغيلها. إنه مناسب عندما لا أرغب في استخدام سماعات الرأس، أو حمل الهاتف إلى أذني، أو تشغيل الصوت بصوت عالٍ. وجود خيار مشابه في المنتدى سيجعل الملاحظات الصوتية أكثر عملية. وشخصية.
بالطبع، المنتديات ليست مصممة بالضبط للأشخاص الذين لا يحبون القراءة أو الكتابة، أو الذين يجدون صعوبة في التبديل بين التطبيقات لمجرد نسخ ولصق النص المنسوخ. ولكن في حالتي، يصل معظم الأشخاص في المنتدى الذي أديره إلى ديسكورس من أجهزتهم المحمولة بدلاً من أجهزة الكمبيوتر. أتخيل أن هذا يغير كيف ومتى يشاركون. قد يتخلى الكثيرون عن النشر ببساطة لأنهم لا يستطيعون الكتابة كثيرًا في تلك اللحظة. إن القدرة على التحدث ونشر ملاحظة صوتية، أو الأفضل من ذلك، نسخ الكلام إلى نص وتعديله لاحقًا، سيحدث فرقًا كبيرًا.
من ناحية أخرى، تجعل الملاحظات الصوتية الإشراف أكثر صعوبة، لذا هذا شيء نحتاج إلى التفكير فيه بشكل جماعي، مع الأخذ في الاعتبار أكبر عدد ممكن من سيناريوهات المستخدمين المختلفة.
أوه. أنت على حق.
أرى. هذا لأنني كبير في السن. أنا فقط أكره التحدث إلى جهاز كمبيوتر. حتى عندما يكون ذلك أسرع بوضوح من إصراري على الكتابة على لوحة المفاتيح على هاتفي.
وجود واجهة تسمح لك بتسجيل أو تحميل ملف صوتي ثم نسخه لا ينبغي أن يكون صعبًا جدًا. أعتقد أن مكون سمة يمكنه القيام بجزء التحميل وربما يمكن للمكون الإضافي الحالي للذكاء الاصطناعي التعامل مع النسخ. (والشيء المضحك هو أنني قضيت الأسابيع القليلة الماضية أو الثلاثة في أداة نسخ مفتوحة المصدر!)
حسنًا، التسجيل ليس طلبًا جديدًا في الواقع، وكان من الصعب جدًا العمل به بشكل صحيح في وقت سابق. ولكن - المنتدى لا يلتقط الصور أو الفيديو، فلماذا يجب أن يكون الصوت مختلفًا؟ لدينا جميعًا أجهزة يمكنها القيام بذلك والباقي هو مجرد مشغل واحد لطيف
حسنًا، أفهم وجهة نظرك، لكنها ليست بنفس طبيعة الوسيط.
في المنتدى، نشارك بشكل عام صورًا أنشأها شخص آخر، لكن الملاحظات الصوتية عادةً ما تحتوي على صوتك الخاص بطريقة شخصية أكثر. على الأقل هذا هو الهدف.
الجهد المبذول في إنتاج صورك ومقاطع الفيديو والملاحظات الصوتية الخاصة بك مختلف تمامًا - وعادةً ما تكون الملاحظات الصوتية هي الطريقة الأسرع والأكثر مباشرة لمشاركة فكرة. غالبًا ما يتطلب التقاط صورة أو اختيارها، أو تسجيل وتحميل مقطع فيديو، خطوات إضافية.
ولكن مع الصوت، خاصةً إذا كانت الميزة مدمجة في الأداة التي تستخدمها بالفعل، يمكنك ببساطة التحدث والإرسال. إنها حاجز أقل للمساهمة، وهذا هو السبب في أنني أرى قيمة في وجود هذا الخيار في بيئة المنتدى.
أرى قيمة أكبر في القدرة على النسخ النصي ووجود كل من الصوت والنص، بسبب تحديات الإشراف والبحث التي يمكن أن يجلبها الصوت فقط.
أود أن أضيف صوتي إلى فكرة سويلين. زوجتي وأختها مصابتان بمرض باركنسون وتستخدمان سيري لإرسال كل رسالة وبريد إلكتروني. أشاهد وأفكر في تفاصيل استخدامهما كل يوم وأفكر في كيف يمكن للأشخاص غير المعاقين أيضًا التفاعل بشكل أفضل مع برامجهم عبر الصوت.
بينما يعتبر Discourse رائعًا من نواحٍ عديدة، فإن ميزته الأساسية مقارنة بأنظمة BBS القديمة هي أنه يعمل بشكل جيد على الهواتف والأجهزة اللوحية وكذلك في المتصفح. والهواتف هي في المقام الأول أجهزة صوتية.
لو كنت سأقوم بإنشاء مجموعة اختبار لما يحتاجه Discourse ليكون عليه في 2030-35، فسوف تتضمن القدرة على الانتقال إلى موقع Discourse بهاتف والتنقل في المجتمع سمعيًا فقط. من الناحية المثالية، يمكن للمرء التنقل في فئاته ومواضيعه عبر الصوت فقط وتحويل النص إلى كلام للمحتوى عند الطلب.
أكثر أهمية بكثير من الذكاء الاصطناعي وأسهل في التنفيذ. وبينما سيكون لكل جهاز طريقته الخاصة في تحويل الكلام إلى نص وتصحيح الأخطاء، فإنك لا تريد الاعتماد على هذه الأنظمة لتكون جيدة أو مجانية أو متسقة إذا استطعت.
ستكون ميزة ضخمة لأن Discourse يحتوي على الكثير، وأنا فضولي بشأن تكاليف النسخ، لكنني أعتقد أنها بالفعل اقتراح جدير بالاهتمام للغاية للنظر فيه.
لدينا من حيث المبدأ، وعمليًا، الأدوات اللازمة بالفعل إذا تم استخدامها. لقد تحدثت هذا النص باللغة الفنلندية. بعد ذلك، قام الذكاء الاصطناعي بترجمته إلى اللغة الإنجليزية وكل شيء على ما يرام.