Ответ с аудиозаписью вместо текста

У нас есть пользователь, который начал публиковать свои ответы в виде аудиозаписей вместо текстовых. Делает он это ради удобства, а не из-за проблем с доступностью. Наши модераторы и администраторы уже начали обсуждать этот вопрос, и я хочу узнать, сталкивался ли кто-то здесь с подобным и как это решалось.

Разрешаете ли вы (или разрешили бы) ответы только в аудиоформате? Какие аспекты следует учитывать при принятии решения о разрешении или запрете аудиоответов?

5 лайков

Но в ущерб удобству всех остальных. Если вы хотите ответить на их «пост», он не перед глазами в письменном виде, вы не можете легко процитировать текст и так далее. Лично я не был бы слишком в восторге от этого.

6 лайков

Я бы не поддержал это здесь. Контент не будет отображаться в поиске и для будущих путешественников, поэтому это, по сути, будет одноразовый вклад.

Не могли бы они вместо этого использовать какое-нибудь приложение для диктовки?

4 лайка

Согласен — это были одни из моих главных опасений. Я не подумал об аспекте поиска, это критически важно, спасибо, что подняли этот вопрос!

Я уверен, что они могли бы использовать приложение для диктовки. Мы составили короткий список приложений, которые могли бы им предложить. Думаю, сначала мы свяжемся с ними лично, чтобы скорректировать подход и посмотреть, поможет ли это.

Честно говоря, я вряд ли стану слушать пятиминутный аудиопост в глубине обсуждения, и интуиция подсказывает, что многие другие тоже не будут. У меня и так нет достаточной концентрации для восприятия аудио, мне пришлось бы делать заметки, чтобы ответить!

2 лайка

Да, я бы однозначно отказался. Сама мысль о модерации такого контента отталкивает. Они могут говорить что угодно, и мне пришлось бы прослушивать всё, чтобы это выяснить. Если они длятся по 5 минут, меня бы не удивило, если бы они вставили туда рекламную паузу. Я не уверен в точной разнице между скоростью чтения и скоростью восприятия на слух, но, думаю, она будет существенной.

8 лайков

Может, стоит предложить ему использовать функцию «голос в текст» (диктовку)?

1 лайк

Интересно, насколько сложно было бы создать компонент плагина или темы, который автоматически транскрибировал бы аудио, чтобы оно также было в текстовом виде, потому что мне бы очень хотелось, чтобы люди могли отвечать голосом, при условии, что это также предоставляло бы текст.

Решит ли это вашу задачу?

5 лайков

Это культурное различие? В некоторых странах голосовые ответы очень распространены

7 лайков

Не стоит слишком переживать. Обсуждать это смогут только те, кто хочет слушать аудио.

1 лайк

Я думал об этом вчера. Я хотел бы внедрить этот формат в своей установке, но пока не знал, как это сделать.

Практически любое устройство может записывать, а затем достаточно просто загрузить файл. Но это работает:

Однако аудио и видео могут довольно быстро занять ваше место на диске.

4 лайка

hug

В Threads от Meta это реализовано. Можно отправить голосовое сообщение, и оно будет транскрибировано, чтобы пост можно было также прочитать. Это кажется лучшим решением для людей с проблемами визуальной доступности, а иногда приятно услышать, как звучат люди, и услышать реальную интонацию слов.

С другой стороны, большинство людей уже умеют использовать преобразование речи в текст. На моем телефоне есть кнопка микрофона на экранной клавиатуре, и она диктует то, что я говорю, в текст. Единственный нюанс в том, что при этом не сохраняется аудиозапись. Я мог бы отправить это сообщение через преобразование речи в текст прямо сейчас, если бы захотел.

Я бы в неформальном порядке написал этому пользователю в личные сообщения, чтобы узнать, не хочет ли он попробовать преобразование речи в текст, объяснив, что текстовый трафик гораздо эффективнее загрузки файлов. Возможно, он просто диктует себе «записку» в машине. Если то, что он говорит, слишком длинное для набора текста, похоже, ему стоит завести подкаст и отправлять людям ссылки на него.

Возможно, некоторым форумам стоит выделить отдельную категорию для «аудио-обсуждений», если это популярно? Во многих чатах Discord, в которых я участвовал, есть каналы для голосового общения, но люди редко заходят туда, если это не запланированная встреча или мероприятие.

У нас иногда возникает похожая дилемма с чатом в Discourse. Пользователи кричат: «МЫ ХОТИМ ЧАТ», мы создаем канал, а потом они спрашивают: «ГДЕ ВСЕ?», и в итоге чат функционирует по сути как странная поток сознания тема форума, которую люди посещают время от времени. (Мы ценим чат, и у нас есть наши ярые группы друзей, которые используют его скорее как групповые SMS на телефоне.) Похоже, пользователь, написавший исходное сообщение, поступает именно так, только это было бы похоже на общение через голосовую почту, что звучит совсем не весело.

Как уже предлагалось ранее, ситуация может исправиться сама собой, поскольку большинство пользователей, вероятно, чувствуют то же самое, и если ваши голосовые сообщения не получают ответов, люди естественным образом перестанут так делать.

3 лайка

Большинство людей не могут этого сделать в глобальном масштабе. Просто небольшое напоминание.

2 лайка

Интересная тема.

Я использую Gboard на Android с приложением Meta для преобразования речи в текст. Я делаю это потому, что родился правшой, но теперь это не работает, поэтому набор текста очень медленный.

Текст, набранный вручную, — это формат с изменяющимся положением в мире. Я думаю, что его распространённость будет снижаться. ИИ уже способен выполнять перевод, преобразование речи в текст и текста в речь, поэтому вопросы поиска, прерывания рекламы и тому подобное имеют лишь краткосрочное значение и скоро станут неактуальными.

Разница в скорости заключается в том, что люди обычно думают со скоростью 600–800 слов в минуту, а говорят — 200 или меньше. Воспроизведение аудио со скоростью 1,7 раза примерно оптимально для прослушивания, потому что дикция людей затрудняет распознавание слов, и я подозреваю, что обработка ИИ довольно скоро устранит этот барьер.

Автоматическое суммирование вместе с фильтрами интересов и другими формами сопоставления интересов с материалами (похоже на то, как сейчас куки служат рекламодателям) — это всё лишь переходные вызовы.

Речь и текст — это просто форматы для ввода и вывода. Поэтому скоро появится поддержка использования текста/речи как варианта вывода для читателей, а также речи и текста как варианта ввода — я уверен, что это не за горами.

Не каждый форум модерируется так, как этот, поэтому вопрос прослушивания каждого сообщения, даже при отсутствии поддержки ИИ, не является универсальным. Не используя продукты Apple, я не знаком с функцией преобразования речи в текст на них, но Gboard на Android бесплатен, и любой, у кого есть технология для доступа к форуму на базе Discourse, находится не так далеко от универсального доступа к преобразованию речи в текст со встроенным переводом естественного языка.

Эта тема — один из многих способов, которыми открываются новые парадигмы в эволюции цифровых сообществ.

2 лайка