Temos um usuário que começou a postar suas respostas por meio de uma gravação de áudio em vez de escrever sua resposta. Ele está fazendo isso por conveniência, não por uma questão de acessibilidade. Nossos moderadores e administradores começaram a discutir isso, e estou me perguntando se alguém aqui já lidou com isso e como lidou.
Você permite (ou permitiria) respostas apenas em áudio? Quais são algumas considerações para permitir ou não permitir respostas em áudio?
Mas para a inconveniência de todos os outros. Se você quiser responder à ‘postagem’ deles, ela não está na sua frente por escrito, você não pode citar facilmente o texto, etc. Pessoalmente, eu não estaria muito animado com isso.
Eu não seria a favor disso aqui. O conteúdo também não apareceria nas buscas para futuros viajantes, então seria essencialmente uma contribuição descartável.
Eles não podem usar algum tipo de aplicativo de ditado em vez disso?
Concordo - essas foram algumas das minhas maiores preocupações. Eu não tinha pensado no aspecto da pesquisa, isso é crucial, obrigado por levantar isso!
Tenho certeza de que eles poderiam usar um aplicativo de ditado. Criamos uma lista curta de aplicativos que poderíamos sugerir a eles, minha aposta é que entraremos em contato privadamente primeiro para corrigir o curso e ver se isso resolve.
Para ser honesto, não é provável que eu ouça uma resposta de áudio de 5 minutos no meio de um tópico e meu instinto diz que muitas pessoas também não. Eu não tenho a capacidade de atenção para áudio como está, eu teria que fazer anotações para poder responder!
Sim, para mim seria um grande não. O pensamento de moderar esse tipo de conteúdo também. Eles poderiam estar dizendo qualquer coisa, e eu teria que ouvir tudo para descobrir. Se eles tiverem 5 minutos de duração, não me surpreenderia se eles inserissem um intervalo comercial. Não tenho certeza da diferença exata entre velocidade de leitura e velocidade de audição, mas acho que será significativa.
Eu me pergunto o quão difícil seria criar um plugin/componente de tema que transcrevesse automaticamente o áudio para que também ficasse em forma escrita, porque eu realmente adoraria se as pessoas pudessem responder por áudio, desde que também fornecesse o texto.
O Threads da Meta faz isso. Você pode postar uma gravação de voz e ele a transcreve para que você também possa ler a postagem. Isso parece ser o melhor dos dois mundos para pessoas com problemas de acessibilidade visual, e às vezes é bom ouvir como as pessoas soam e a inflexão real das palavras verbalmente.
O inverso é que a maioria das pessoas já consegue usar a conversão de voz em texto. Meu telefone tem um botão de microfone como parte do teclado na tela e ele ditará o que eu digo em texto. A única coisa é que isso não envolve manter a gravação de áudio. Eu poderia postar isso por voz para texto agora mesmo, se quisesse.
Eu enviaria uma mensagem privada casualmente ao usuário para ver se ele poderia usar a conversão de voz em texto, explicando que a largura de banda de texto é muito mais eficiente do que o upload de arquivos. É possível que eles estejam fazendo essa digitação “lembrete para mim” no carro. Se o que eles estão digitando for muito longo para digitar, parece que eles deveriam realmente começar um podcast e vincular as pessoas a ele.
Talvez alguns fóruns possam justificar uma categoria específica para “discussão em áudio”, se for algo grande? Muitos chats do Discord em que participei têm canais de bate-papo por áudio, mas é raro as pessoas estarem neles, a menos que seja um encontro ou evento planejado.
Temos esse dilema semelhante com o chat do Discourse às vezes. Os usuários dizem “QUEREMOS CHAT” e nós criamos um canal, então eles dizem “ONDE ESTÁ TODO MUNDO?” e o chat acaba funcionando basicamente como um tópico de fórum de fluxo de consciência estranho que as pessoas visitam ocasionalmente. (Nós apreciamos o chat e temos nossos grupos de amigos hardcore que o usam mais como um SMS em grupo em seus telefones.) O usuário do OP parece estar fazendo isso, apenas seria como se comunicar por correio de voz, o que não parece divertido.
Como sugerido anteriormente, isso pode se autocorrigir, pois a maioria dos usuários provavelmente sente o mesmo e, se seu respondedor por voz não obtiver respostas, ele naturalmente parará de fazê-lo.
Eu uso o gboard no Android com o aplicativo meta como conversão de voz em texto. Faço isso porque nasci destro e agora não funciona mais, então digitar é muito lento.
O texto digitado é um formato com uma posição em mudança no mundo. Acho que sua prevalência diminuirá. A IA já é capaz de tradução de idiomas e conversão de voz em texto e texto em voz, portanto, as questões de pesquisa e interrupções de publicidade, etc., são apenas de curto prazo e se tornarão irrelevantes.
As diferenças de velocidade são que as pessoas geralmente pensam a 600 a 800 palavras por minuto e falam a 200 ou menos. Reproduzir áudio a 1,7 é quase ideal para ouvir apenas porque a dicção das pessoas dificulta a detecção das palavras e suspeito que o processamento de IA removerá essa barreira em breve.
Resumo automático, juntamente com filtros de interesse e outras formas de correspondência de interesses a contribuições (semelhante à forma como os cookies atualmente atendem aos anunciantes), são apenas desafios transitórios.
Voz e texto são apenas formatos para a entrada e a saída. Portanto, em breve surgirá suporte para o uso de texto/voz como opção para leitores de saída, bem como voz/texto como opção de entrada - tenho certeza de que não está longe.
Nem todo fórum é moderado como este, então a questão de ouvir cada postagem, mesmo que você não tenha suporte de IA, não é universal. Por não ter usado Apple, não sei sobre a conversão de voz em texto, mas o gboard no Android é gratuito e qualquer pessoa que tenha a tecnologia para acessar um fórum baseado em discussão não está longe de ter acesso universal à conversão de voz em texto com tradução de linguagem natural integrada.
Este tópico é uma das muitas maneiras pelas quais novos paradigmas são abertos na evolução da comunidade habilitada digitalmente.