Tenemos un usuario que ha comenzado a publicar sus respuestas a través de una grabación de audio en lugar de escribir su respuesta. Lo hace por conveniencia, no por un problema de accesibilidad. Nuestros moderadores y administradores han comenzado a discutirlo, y me pregunto si alguien aquí ha lidiado con esto y cómo lo ha manejado.
¿Permiten (o permitirían) respuestas solo de audio? ¿Cuáles son algunas consideraciones para permitir o no permitir respuestas de audio?
Pero para inconveniencia de todos los demás. Si quieres responder a su ‘publicación’, no la tienes delante por escrito, no puedes citar fácilmente el texto, etc. Personalmente, no estaría muy entusiasmado con esto.
No estaría a favor de eso aquí. El contenido tampoco aparecería en las búsquedas para futuros viajeros, por lo que sería esencialmente una contribución desechable.
¿No pueden usar algún tipo de aplicación de dictado en su lugar?
Estoy de acuerdo: estas fueron algunas de mis mayores preocupaciones. No había pensado en el aspecto de la búsqueda, ¡eso es crucial, gracias por mencionarlo!
Estoy seguro de que podrían usar una aplicación de dictado. Elaboramos una lista corta de aplicaciones que podríamos sugerirles; supongo que nos comunicaremos en privado primero para corregir el rumbo y ver si eso funciona.
Para ser honesto, no es probable que escuche una respuesta de audio de 5 minutos de duración en medio de un tema y mi instinto me dice que muchas personas tampoco lo harán. No tengo la capacidad de atención para el audio tal como está, ¡tendría que tomar notas para poder responder!
Sí, para mí sería un rotundo no. El pensamiento de moderar ese tipo de contenido también. Podrían decir cualquier cosa, y yo tendría que escucharlo todo para averiguarlo. Si tuvieran 5 minutos de duración, no me sorprendería que incluyeran una pausa publicitaria. No estoy seguro de la diferencia exacta entre la velocidad de lectura y la velocidad de escucha, pero creo que será significativa.
Me pregunto qué tan difícil sería crear un componente de plugin/tema que transcribiera automáticamente el audio para que también estuviera en forma escrita, porque realmente me encantaría que la gente pudiera responder por audio siempre que también proporcionara el texto.
Meta’s Threads hace esto. Puedes publicar una grabación de voz y la transcribe para que también puedas leer la publicación. Esto parece ser lo mejor de ambos mundos para personas con problemas de accesibilidad visual, y a veces es agradable escuchar cómo suenan las personas y la inflexión real de las palabras verbalmente.
Lo contrario es que la mayoría de las personas ya pueden usar el reconocimiento de voz. Mi teléfono tiene un botón de micrófono como parte del teclado en pantalla y dictará lo que le digo en texto. Lo único es que no implica conservar la grabación de audio. Podría publicar esto a través de voz a texto ahora mismo si quisiera.
Le enviaría un mensaje privado informalmente al usuario para ver si podría usar el reconocimiento de voz, explicándole que el ancho de banda de texto es mucho más eficiente que las cargas de archivos. Es posible que esté haciendo esa dictación de “nota para mí” en el coche. Si lo que está escribiendo es demasiado largo para escribirlo, parece que debería empezar un podcast y enlazar a la gente a él.
Quizás algunos foros justifiquen una categoría específica para “discusión de audio” si es algo importante. Muchos chats de Discord en los que he participado tienen canales de chat de audio, pero es raro que la gente esté en ellos a menos que sea una reunión o evento planificado.
Tenemos un dilema similar con el chat de Discourse a veces. Los usuarios dicen QUEREMOS CHAT y creamos un canal, luego dicen ¿DÓNDE ESTÁ TODO EL MUNDO? y el chat termina funcionando básicamente como un tema de foro de flujo de conciencia extraño que la gente visita ocasionalmente. (Agradecemos el chat y tenemos nuestros grupos de amigos incondicionales que lo usan más como un SMS grupal en su teléfono). El usuario del OP suena como si estuviera haciendo eso, solo que sería como comunicarse por correo de voz, lo cual no suena divertido.
Como se sugirió anteriormente, esto podría autocorregirse, ya que la mayoría de los usuarios probablemente sienten lo mismo y si su respondedor de voz no recibe respuestas, naturalmente dejará de hacerlo.
Uso gboard en Android con la aplicación meta como voz a texto. Lo hago porque nací diestro y ahora no funciona, por lo que escribir es muy lento.
El texto escrito es un formato con una posición cambiante en el mundo. Creo que su prevalencia disminuirá. La IA ya es capaz de traducir idiomas y de voz a texto y de texto a voz, por lo que las cuestiones de búsqueda y de interrupciones publicitarias, etc., son solo a corto plazo y se volverán irrelevantes.
Las diferencias de velocidad son que las personas generalmente piensan a 600 u 800 palabras por minuto y hablan a 200 o menos. Reproducir audio a 1.7 es casi óptimo para escuchar solo porque la dicción de las personas dificulta la detección de las palabras y sospecho que el procesamiento de IA eliminará esa barrera muy pronto.
El resumen automático junto con los filtros de interés y otras formas de hacer coincidir intereses con contribuciones (similar a la forma en que las cookies actualmente sirven a los anunciantes) son solo desafíos transitorios.
El habla y el texto son solo formatos para la entrada y la salida. Por lo tanto, pronto surgirá soporte para el uso de texto/voz como opción para los lectores de salida, así como voz a texto como opción de entrada; estoy seguro de que no está muy lejos.
No todos los foros son moderados como este, por lo que la cuestión de escuchar cada publicación, incluso si no tienes soporte de IA, no es universal. Al no haber usado Apple, desconozco la voz a texto, pero gboard en Android es gratuito y cualquiera que tenga la tecnología para acceder a un foro basado en el discurso no está lejos de tener acceso universal a voz a texto con traducción de lenguaje natural incorporada.
Este tema es una de las muchas formas en que se abren nuevos paradigmas en la evolución de la comunidad habilitada digitalmente.