Nous avons un utilisateur qui a commencé à publier ses réponses sous forme d’enregistrement audio au lieu d’écrire sa réponse. Il le fait par commodité, et non pour des raisons d’accessibilité. Nos modérateurs et administrateurs ont commencé à en discuter, et je me demande si quelqu’un ici a déjà été confronté à cela et comment ils l’ont géré.
Autorisez-vous (ou autoriseriez-vous) les réponses audio uniquement ? Quelles sont les considérations pour autoriser ou interdire les réponses audio ?
Mais au détriment de tous les autres. Si vous voulez répondre à leur « publication », elle n’est pas devant vous par écrit, vous ne pouvez pas facilement citer le texte, etc. Personnellement, je ne serais pas très enthousiaste à l’idée.
Je ne serais pas favorable à cela ici. Le contenu n’apparaîtrait pas non plus dans les recherches pour les futurs voyageurs, ce serait donc essentiellement une contribution jetable.
Ne peuvent-ils pas utiliser une sorte d’application de dictée à la place ?
D’accord - c’étaient quelques-unes de mes plus grandes préoccupations. Je n’avais pas pensé à l’aspect recherche, c’est crucial, merci de l’avoir soulevé !
Je suis certain qu’ils pourraient utiliser une application de dictée. Nous avons dressé une courte liste d’applications que nous pourrions leur suggérer, je suppose que nous les contacterons d’abord en privé pour corriger le tir et voir si cela suffit.
Pour être honnête, je ne suis pas susceptible d’écouter une réponse audio de 5 minutes au milieu d’un sujet et mon instinct me dit que beaucoup de gens ne le sont pas non plus. Je n’ai pas la capacité d’attention pour l’audio tel quel, je devrais prendre des notes pour pouvoir répondre !
Ouais, ce serait un non catégorique pour moi. La pensée de modérer ce genre de contenu également. Ils pourraient dire n’importe quoi, et je devrais tout écouter pour le découvrir. S’ils durent 5 minutes, je ne serais pas surpris s’ils glissaient une coupure publicitaire. Je ne suis pas sûr de la différence exacte entre la vitesse de lecture et la vitesse d’écoute, mais je pense qu’elle sera significative.
Je me demande quelle serait la difficulté de créer un composant de plugin/thème qui transcrit automatiquement l’audio afin qu’il soit également sous forme écrite, car j’aimerais beaucoup que les gens puissent répondre par audio tant qu’il y a aussi le texte.\n\nCela résoudrait-il votre problème ?
Threads de Meta fait cela. Vous pouvez publier un enregistrement vocal et il le transcrit afin que vous puissiez également lire le message. Cela semble être le meilleur des deux mondes pour les personnes ayant des problèmes d’accessibilité visuelle, et parfois, il est agréable d’entendre à quoi ressemblent les gens et l’inflexion réelle des mots verbalement.
Inversement, la plupart des gens peuvent déjà utiliser la reconnaissance vocale. Mon téléphone a un bouton microphone sur le clavier à l’écran et il dictera ce que je lui dis en texte. La seule chose est que cela n’implique pas de conserver l’enregistrement audio. Je pourrais publier cela par reconnaissance vocale dès maintenant si je le voulais.
Je contacterais discrètement l’utilisateur par message privé pour voir s’il pourrait utiliser la reconnaissance vocale, en expliquant que la bande passante textuelle est beaucoup plus efficace que les téléchargements de fichiers. Il est possible qu’il fasse cette dictée “mémos pour moi” en voiture. Si ce qu’il tape est trop long à taper, il semble qu’il devrait en fait lancer un podcast et y lier les gens.
Peut-être que certains forums pourraient justifier une catégorie spécifique pour la « discussion audio » si c’est une chose importante ? De nombreux chats Discord auxquels j’ai participé ont des canaux de discussion audio, mais il est rare que les gens y soient, sauf s’il s’agit d’une rencontre ou d’un événement planifié.
Nous avons un dilemme similaire avec le chat Discourse parfois. Les utilisateurs disent NOUS VOULONS DU CHAT et nous créons un canal, puis ils disent OÙ EST TOUT LE MONDE ? et le chat finit par fonctionner essentiellement comme un sujet de forum étrange de flux de conscience que les gens visitent occasionnellement. (Nous apprécions le chat et nous avons nos groupes d’amis fidèles qui l’utilisent davantage comme un SMS de groupe sur leur téléphone.) L’utilisateur de l’OP semble faire cela, seulement ce serait comme communiquer par messagerie vocale, ce qui ne semble pas amusant.
Comme suggéré précédemment, cela pourrait s’auto-corriger car la plupart des utilisateurs ressentent probablement la même chose et si votre répondeur vocal ne reçoit pas de réponses, il arrêtera naturellement de le faire.
J’utilise gboard sur Android avec l’application Meta comme synthèse vocale. Je le fais parce que je suis né droitier et que cela ne fonctionne plus, donc la frappe est très lente.
Le texte tapé est un format dont la position dans le monde change. Je pense que sa prévalence va diminuer. L’IA est déjà capable de traduction linguistique et de synthèse vocale et de synthèse vocale, donc les questions de recherche et de rupture publicitaire, etc. ne sont que de courte durée et deviendront obsolètes.
Les différences de vitesse sont que les gens pensent généralement à 600 à 800 mots par minute et parlent à 200 mots ou moins. Rejouer l’audio à 1,7 est à peu près optimal pour l’écoute uniquement parce que la diction des gens rend la détection des mots difficile et je soupçonne que le traitement par IA supprimera cette barrière assez bientôt.
Le résumé automatique, ainsi que les filtres d’intérêt et d’autres formes de mise en correspondance des intérêts avec les contributions (similaires à la façon dont les cookies servent actuellement les annonceurs) ne sont que des défis transitoires.
La parole et le texte ne sont que des formats pour l’entrée et la sortie. Ainsi, un support émergera bientôt pour l’utilisation du texte/de la parole comme option pour les lecteurs de sortie, ainsi que la parole comme option d’entrée - je suis sûr que ce n’est pas loin.
Tous les forums ne sont pas modérés comme celui-ci, donc la question d’écouter chaque message même si vous n’avez pas de support IA n’est pas universelle. N’ayant pas utilisé Apple, j’ignore la synthèse vocale, mais gboard sur Android est gratuit et toute personne disposant de la technologie pour accéder à un forum basé sur le discours n’est pas loin d’avoir un accès universel à la synthèse vocale avec traduction linguistique intégrée.
Ce sujet est l’une des nombreuses façons dont de nouveaux paradigmes s’ouvrent dans l’évolution de la communauté numériquement activée.