Demande de fonctionnalité : Enregistrement natif de messages vocaux et transcription audio automatique

Salut l’équipe Discourse,

Je souhaiterais suggérer une nouvelle fonctionnalité qui ferait une énorme différence en termes d’accessibilité et d’engagement sur la plateforme Discourse : la prise en charge native de l’enregistrement et de la publication de messages audio directement dans les sujets et les réponses, ainsi que la transcription automatique de l’audio en texte (similaire à ce que proposent Instagram et WhatsApp). J’ai vu quelques discussions sur des plugins et des composants pour cette capacité, y compris l’information selon laquelle celui disponible ne fonctionne pas actuellement. Comme je n’ai pas l’expertise nécessaire pour installer un plugin depuis GitHub moi-même et essayer, un outil natif intégré au système avec simplement un interrupteur d’activation/désactivation serait formidable pour les utilisateurs finaux novices comme moi =)

Pourquoi cette fonctionnalité ?

Pour de nombreuses personnes, la saisie au clavier n’est pas toujours le moyen de communication le plus efficace ou le plus accessible. Cela peut inclure :

  • Les personnes en situation de handicap ou souffrant de blessures temporaires qui rendent la saisie difficile.

  • Les membres de la communauté qui préfèrent parler en raison de leur niveau d’alphabétisation ou de leur confort.

  • Les utilisateurs sur mobile qui souhaitent une communication plus rapide et mains libres.

Permettre aux utilisateurs d’enregistrer et de publier de l’audio (notes vocales), y compris dans les commentaires, réduirait considérablement les barrières à la participation et rendrait les communautés Discourse plus inclusives.

Pourquoi la transcription est-elle importante ?

La transcription automatique des messages vocaux garantirait que tous les utilisateurs, y compris ceux qui ne peuvent pas écouter l’audio (par exemple, en raison d’une déficience auditive ou lorsqu’ils se trouvent dans un environnement calme), puissent toujours participer et s’engager pleinement avec le contenu de la plateforme.

L’intégration native (comme le font Instagram, WhatsApp ou Google Messages) rapprocherait les plateformes Discourse des normes de pointe en matière d’inclusivité et d’accessibilité.

Ce qui a été essayé jusqu’à présent ?

J’ai vu qu’il y a eu des solutions communautaires précédentes :

Cependant, la plupart d’entre eux ne sont soit pas activement maintenus, soit pas entièrement intégrés, soit manquent de fonctionnalités de transcription. Il y a un intérêt communautaire clair et continu concernant les fonctionnalités audio et la voix-au-texte intégrée.

Fonctionnalité suggérée

  • Permettre l’enregistrement audio direct (notes vocales) dans le compositeur pour les sujets et les réponses.

  • Prendre en charge le téléchargement de fichiers audio comme alternative.

  • S’intégrer à un service de reconnaissance vocale pour générer et afficher automatiquement une transcription avec chaque message audio.

  • Option pour modifier ou corriger les transcriptions avant de publier.

  • Contrôles de modération pour gérer et examiner le contenu audio.

Conclusion

Cette fonctionnalité distinguerait Discourse en tant que plateforme inclusive et moderne qui soutient une diversité d’utilisateurs et de situations.

Merci de prendre cela en considération ! Je (et d’autres membres de la communauté) serions vraiment ravis de voir tout mouvement dans cette direction.

7 « J'aime »

Personnellement, j’adorerais ça. Je me suis cassé la main l’année dernière et, bien que la dictée d’Apple fonctionne très bien, j’aurais aimé pouvoir le faire directement dans Discourse aussi. Cela dit, personnellement, j’ai tendance à divaguer quand je dicte ! :rire:

J’aimerais aussi cela pour le forum de ma famille où, entre autres choses, nous partageons et parlons de photos. Pouvoir enregistrer un message pour que la voix soit capturée, puis le voir transcrit, serait de l’or pur.

Merci d’avoir posté la demande de manière aussi concise.

3 « J'aime »

Cela semble être quelque chose qui devrait être géré du côté de l’ordinateur. Apprendre à utiliser un système de dictée et le faire fonctionner semble déjà assez difficile. Avoir un système différent sur chaque logiciel que vous utilisez semble être terrible. Essayer de prendre en charge la dictée sur plusieurs plateformes via le navigateur semble également intenable.

Ne préféreriez-vous pas voir que la reconnaissance vocale fonctionne réellement avant qu’elle ne soit téléchargée sur un forum ? La reconnaissance vocale ne fonctionne-t-elle pas mieux sur votre propre ordinateur où elle peut être entraînée à votre propre voix ?

Je suis tout à fait favorable au soutien de toutes sortes d’utilisateurs, mais je ne vois pas comment il serait logique que chaque application web soit responsable de la transcription. Nous ne nous attendons pas à ce que Discourse lise du texte aux aveugles, Discourse fournit du HTML avec lequel l’application que l’utilisateur choisit peut fonctionner.

6 « J'aime »

L’accessibilité est un cas d’utilisation (probablement le principal), mais pas le seul.

Puisqu’un forum est destiné à faciliter des interactions significatives et à construire une communauté, offrir plus d’une façon de partager une pensée semble précieux. Je ne sais pas quelle serait la complexité de ce projet d’un point de vue développement, ni si cela en vaudrait la peine, mais je pense constamment à la facilité avec laquelle les gens s’expriment dans les groupes WhatsApp simplement parce que l’option d’enregistrer une note vocale est juste là. Ce serait merveilleux d’avoir quelque chose de similaire dans un forum, où les conversations peuvent être mieux organisées par sujets et catégories.

J’utilise moi-même souvent la fonction d’Instagram qui transcrit les notes vocales au lieu de les lire. C’est pratique quand je ne veux pas utiliser d’écouteurs, tenir le téléphone à mon oreille ou jouer l’audio à voix haute. Avoir une option similaire dans un forum rendrait les notes vocales beaucoup plus pratiques. Et personnelles.

Bien sûr, les forums ne sont pas exactement conçus pour les personnes qui n’aiment pas lire ou écrire, ou qui trouvent trop compliqué de passer d’une application à l’autre juste pour copier-coller du texte transcrit. Mais dans mon cas, la plupart des personnes sur le forum que je gère accèdent à Discourse depuis leurs appareils mobiles plutôt que depuis leurs ordinateurs. J’imagine que cela change la façon et le moment où elles participent. Beaucoup pourraient abandonner la publication simplement parce qu’elles ne peuvent pas taper beaucoup à ce moment-là. Pouvoir parler et publier une note vocale, ou mieux encore, transcrire la parole en texte et l’éditer plus tard, ferait une grande différence.

D’un autre côté, les notes vocales rendent la modération plus difficile, c’est donc quelque chose que nous devons examiner collectivement, en tenant compte du plus grand nombre de scénarios d’utilisateurs possible.

2 « J'aime »

OOOOOOOh. Tu as raison.

Je vois. C’est parce que je suis vieux. Je déteste parler à un ordinateur. Même quand ce serait évidemment plus rapide que mon insistance à écrire sur le clavier de mon téléphone.

Avoir une interface qui permettrait d’enregistrer ou de télécharger un fichier audio, puis de le transcrire, ne devrait pas être si difficile. Je pense qu’un composant de thème pourrait gérer la partie téléchargement et que le plugin IA existant pourrait gérer la transcription. (Et le plus drôle, c’est que j’ai passé les deux ou trois dernières semaines sur un outil de transcription Open Source !)

5 « J'aime »

Eh bien, l’enregistrement n’est pas vraiment une nouvelle demande, et il était auparavant raisonnablement difficile de la faire fonctionner correctement. Mais — un forum ne prend pas de photos ou de vidéos, alors pourquoi l’audio devrait-il être différent ? Nous avons tous des appareils qui peuvent le faire et le reste n’est qu’un bon lecteur :thinking:

2 « J'aime »

Eh bien, je comprends votre point de vue, mais ce n’est pas tout à fait la même nature de support.

Sur un forum, nous partageons généralement des images créées par quelqu’un d’autre, mais les notes vocales contiennent habituellement votre propre voix de manière plus personnelle. Du moins, c’est l’objectif.

L’effort requis pour produire ses propres photos, vidéos et notes vocales est très différent — et les notes vocales sont généralement le moyen le plus rapide et le plus direct de partager une pensée. Prendre ou sélectionner une photo, ou enregistrer et télécharger une vidéo, nécessite souvent plus d’étapes.

Mais avec l’audio, surtout si la fonctionnalité est intégrée à l’outil que vous utilisez déjà, vous pouvez simplement parler et envoyer. C’est une barrière à la contribution plus faible, c’est pourquoi je vois de la valeur à avoir cette option dans un forum.

Je vois même plus de valeur dans la capacité de transcrire et d’avoir à la fois l’audio et le texte, en raison des défis de modération et de recherche que l’audio seul pourrait poser.

6 « J'aime »

J’aimerais ajouter mon +1 à l’idée de Suelen. Ma femme et sa sœur sont atteintes de la maladie de Parkinson et elles utilisent Siri pour envoyer tous leurs messages et e-mails. Je regarde et réfléchis chaque jour aux détails de leur utilisation et je pense à la façon dont les personnes non handicapées pourraient également mieux interagir avec leurs logiciels par la voix.

Bien que Discourse soit excellent à bien des égards, sa principale différence par rapport aux anciens systèmes BBS est qu’il fonctionne bien sur les téléphones et les tablettes ainsi que dans le navigateur. Et les téléphones sont principalement des appareils vocaux.

Si je devais créer une suite de tests pour ce que Discourse doit être en 2030-35, elle inclurait la possibilité d’aller sur un site Discourse avec un téléphone et de simplement naviguer dans la communauté à l’oreille. Idéalement, on pourrait naviguer dans ses catégories et ses fils de discussion uniquement par la voix et l’audio, et lire le contenu par synthèse vocale sur demande.

Beaucoup plus important que l’IA et beaucoup plus simple à faire. Et bien que chaque appareil ait sa propre façon de transcrire la parole en texte et de corriger les erreurs, vous ne voulez pas dépendre de la qualité, de la gratuité ou de la cohérence de ces systèmes si vous pouvez l’éviter.

Ce serait une fonctionnalité énorme car Discourse a tellement à offrir, et je suis curieux de connaître le coût des transcriptions, mais je pense que c’est vraiment une suggestion très valable à examiner.

1 « J'aime »

Chez nous, en principe et en pratique, nous avons déjà les outils nécessaires si seulement on les utilise. J’ai parlé ce texte en finnois. Ensuite, il l’a traduit en anglais et tout va bien.

1 « J'aime »