Respondendo com uma gravação de áudio em vez de texto

jenmck · Abril 24, 2024, 3:15am

Temos um usuário que começou a postar suas respostas por meio de uma gravação de áudio em vez de escrever sua resposta. Ele está fazendo isso por conveniência, não por uma questão de acessibilidade. Nossos moderadores e administradores começaram a discutir isso, e estou me perguntando se alguém aqui já lidou com isso e como lidou.

Você permite (ou permitiria) respostas apenas em áudio? Quais são algumas considerações para permitir ou não permitir respostas em áudio?

ondrej · Abril 24, 2024, 7:15am

Mas para a inconveniência de todos os outros. Se você quiser responder à ‘postagem’ deles, ela não está na sua frente por escrito, você não pode citar facilmente o texto, etc. Pessoalmente, eu não estaria muito animado com isso.

JammyDodger · Abril 24, 2024, 7:41am

Eu não seria a favor disso aqui. O conteúdo também não apareceria nas buscas para futuros viajantes, então seria essencialmente uma contribuição descartável.

Eles não podem usar algum tipo de aplicativo de ditado em vez disso?

jenmck · Abril 24, 2024, 7:52am

Concordo - essas foram algumas das minhas maiores preocupações. Eu não tinha pensado no aspecto da pesquisa, isso é crucial, obrigado por levantar isso!

Tenho certeza de que eles poderiam usar um aplicativo de ditado. Criamos uma lista curta de aplicativos que poderíamos sugerir a eles, minha aposta é que entraremos em contato privadamente primeiro para corrigir o curso e ver se isso resolve.

Para ser honesto, não é provável que eu ouça uma resposta de áudio de 5 minutos no meio de um tópico e meu instinto diz que muitas pessoas também não. Eu não tenho a capacidade de atenção para áudio como está, eu teria que fazer anotações para poder responder!

JammyDodger · Abril 24, 2024, 8:04am

Sim, para mim seria um grande não. O pensamento de moderar esse tipo de conteúdo também. Eles poderiam estar dizendo qualquer coisa, e eu teria que ouvir tudo para descobrir. Se eles tiverem 5 minutos de duração, não me surpreenderia se eles inserissem um intervalo comercial. Não tenho certeza da diferença exata entre velocidade de leitura e velocidade de audição, mas acho que será significativa.

MarcP · Abril 24, 2024, 8:19am

Você poderia tentar sugerir que ele use a Fala para Texto (ditado)?

jimkleiber · Abril 24, 2024, 10:42am

Eu me pergunto o quão difícil seria criar um plugin/componente de tema que transcrevesse automaticamente o áudio para que também ficasse em forma escrita, porque eu realmente adoraria se as pessoas pudessem responder por áudio, desde que também fornecesse o texto.

Isso resolveria seu desafio?

awesomerobot · Abril 24, 2024, 2:00pm

Isso é uma diferença cultural? Respostas de voz são muito comuns em alguns países

jesus2099 · Abril 24, 2024, 3:38pm

Não se preocupe muito. Apenas as pessoas que quiserem ouvir áudios poderão discuti-los.

eisammy · Abril 25, 2024, 7:14am

Eu pensei sobre isso ontem, eu gostaria de oferecer este formato na minha instalação, mas eu ainda não sabia como.

Jagster · Abril 25, 2024, 8:21am

Praticamente todo dispositivo pode gravar e, depois disso, é só fazer o upload de um arquivo. Mas isso funciona:

Mas áudio e vídeo podem consumir seu espaço de armazenamento bem rápido.

eisammy · Abril 25, 2024, 9:00am

hug

Hanon_Ondricek · Abril 27, 2024, 5:22pm

O Threads da Meta faz isso. Você pode postar uma gravação de voz e ele a transcreve para que você também possa ler a postagem. Isso parece ser o melhor dos dois mundos para pessoas com problemas de acessibilidade visual, e às vezes é bom ouvir como as pessoas soam e a inflexão real das palavras verbalmente.

O inverso é que a maioria das pessoas já consegue usar a conversão de voz em texto. Meu telefone tem um botão de microfone como parte do teclado na tela e ele ditará o que eu digo em texto. A única coisa é que isso não envolve manter a gravação de áudio. Eu poderia postar isso por voz para texto agora mesmo, se quisesse.

Eu enviaria uma mensagem privada casualmente ao usuário para ver se ele poderia usar a conversão de voz em texto, explicando que a largura de banda de texto é muito mais eficiente do que o upload de arquivos. É possível que eles estejam fazendo essa digitação “lembrete para mim” no carro. Se o que eles estão digitando for muito longo para digitar, parece que eles deveriam realmente começar um podcast e vincular as pessoas a ele.

Talvez alguns fóruns possam justificar uma categoria específica para “discussão em áudio”, se for algo grande? Muitos chats do Discord em que participei têm canais de bate-papo por áudio, mas é raro as pessoas estarem neles, a menos que seja um encontro ou evento planejado.

Temos esse dilema semelhante com o chat do Discourse às vezes. Os usuários dizem “QUEREMOS CHAT” e nós criamos um canal, então eles dizem “ONDE ESTÁ TODO MUNDO?” e o chat acaba funcionando basicamente como um tópico de fórum de fluxo de consciência estranho que as pessoas visitam ocasionalmente. (Nós apreciamos o chat e temos nossos grupos de amigos hardcore que o usam mais como um SMS em grupo em seus telefones.) O usuário do OP parece estar fazendo isso, apenas seria como se comunicar por correio de voz, o que não parece divertido.

Como sugerido anteriormente, isso pode se autocorrigir, pois a maioria dos usuários provavelmente sente o mesmo e, se seu respondedor por voz não obtiver respostas, ele naturalmente parará de fazê-lo.

Jagster · Abril 27, 2024, 5:59pm

A maioria das pessoas não pode usar, globalmente. Apenas um pequeno lembrete.

51mon · Abril 30, 2024, 8:56am

Tópico interessante

Eu uso o gboard no Android com o aplicativo meta como conversão de voz em texto. Faço isso porque nasci destro e agora não funciona mais, então digitar é muito lento.

O texto digitado é um formato com uma posição em mudança no mundo. Acho que sua prevalência diminuirá. A IA já é capaz de tradução de idiomas e conversão de voz em texto e texto em voz, portanto, as questões de pesquisa e interrupções de publicidade, etc., são apenas de curto prazo e se tornarão irrelevantes.

As diferenças de velocidade são que as pessoas geralmente pensam a 600 a 800 palavras por minuto e falam a 200 ou menos. Reproduzir áudio a 1,7 é quase ideal para ouvir apenas porque a dicção das pessoas dificulta a detecção das palavras e suspeito que o processamento de IA removerá essa barreira em breve.
Resumo automático, juntamente com filtros de interesse e outras formas de correspondência de interesses a contribuições (semelhante à forma como os cookies atualmente atendem aos anunciantes), são apenas desafios transitórios.

Voz e texto são apenas formatos para a entrada e a saída. Portanto, em breve surgirá suporte para o uso de texto/voz como opção para leitores de saída, bem como voz/texto como opção de entrada - tenho certeza de que não está longe.

Nem todo fórum é moderado como este, então a questão de ouvir cada postagem, mesmo que você não tenha suporte de IA, não é universal. Por não ter usado Apple, não sei sobre a conversão de voz em texto, mas o gboard no Android é gratuito e qualquer pessoa que tenha a tecnologia para acessar um fórum baseado em discussão não está longe de ter acesso universal à conversão de voz em texto com tradução de linguagem natural integrada.

Este tópico é uma das muitas maneiras pelas quais novos paradigmas são abertos na evolução da comunidade habilitada digitalmente.

Tópico		Respostas	Visualizações
Feature request: Native Voice Message Recording & Automatic Audio Transcription Feature accessibility	8	295	12 de Outubro de 2025
Voice messages for discourse Feature	15	4118	2 de Agosto de 2023
Voice to text integration Support	9	865	13 de Novembro de 2023
Voice Recorder Component Theme component pavilion	138	8566	18 de Outubro de 2025
See who all are writing replies to a topic Feature	41	10695	10 de Agosto de 2016

Respondendo com uma gravação de áudio em vez de texto

Tópicos relacionados