用录音回复而不是文字

我们有一位用户开始通过录音而不是写回复来发布他们的回复。他们这样做是为了方便,而不是因为可访问性问题。我们的版主和管理员已经开始讨论这个问题,我想知道是否有人遇到过这种情况,以及他们是如何处理的。

您是否允许(或会允许)仅音频回复?允许或不允许音频回复需要考虑哪些因素?

5 个赞

但却给其他所有人都带来了不便。如果你想回复他们的“帖子”,它不会呈现在你面前的文字中,你不能轻易地引用文本等。就我个人而言,我不会太热衷于此。

6 个赞

我不会赞成这样做。这些内容也不会出现在未来旅行者的搜索结果中,因此基本上是一次性的贡献。

他们不能改用某种语音输入应用程序吗?

4 个赞

同意——这些是我最大的担忧。我没想到搜索方面的问题,这很重要,谢谢你提出来!

我确信他们可以使用听写应用程序。我们列出了一份我们可以推荐给他们的应用程序的简短列表,我猜我们会先私下联系他们,纠正一下,看看是否能解决问题。

说实话,我不太可能听完一个在话题深处长达5分钟的音频回复,我的直觉告诉我很多人也不会。我本身就没有听音频的注意力,我必须做笔记才能回复!

2 个赞

不,我绝对不会同意。还要考虑审核那种内容。他们可能会说任何话,而我必须听完才能知道。如果它们有 5 分钟长,我不会惊讶他们会插入广告休息。我不确定朗读速度和听力速度的确切区别,但我认为这会很显著。

8 个赞

您可以尝试建议他使用语音转文本(听写)功能?

1 个赞

我想知道制作一个插件/主题组件来自动转录音频有多难,这样它也可以以书面形式呈现,因为我实际上很喜欢人们可以通过音频回复,只要它也提供文本。

这能解决你的挑战吗?

5 个赞

这是文化差异吗?在一些国家,语音回复非常普遍

7 个赞

不用太担心。
只有想听音频的人才能和他们讨论。

1 个赞

我昨天在想,我希望在我的安装中提供这种格式,但我还不知道如何做。

几乎所有设备都可以录制,之后只需上传文件即可。但这行得通:

但音频和视频会很快耗尽您的存储空间。

4 个赞

hug

Meta 的 Threads 就是这样做的。你可以发布一段语音录音,它会将其转录成文字,这样你也可以阅读帖子。这似乎对有视觉障碍的人来说是两全其美,而且有时听听人们的声音和他们口语中的实际语调也很好。

反之,大多数人已经可以使用语音转文本了。我的手机在屏幕键盘上有一个麦克风按钮,它会把我说的话听写成文字。唯一的问题是它不包含保留音频录音。如果我愿意,我现在就可以通过语音转文本来发布这个。

我会私下联系这位用户,看看他们是否愿意使用语音转文本,并解释说文本带宽比文件上传效率高得多。他们可能是在车里进行那种“备忘录给我”的听写。如果他们要写的内容太长,听起来他们应该开始做一个播客并链接给人们。

也许有些论坛可以为“音频讨论”设立一个专门的类别,如果这是一个大问题的话?我参加过的许多 Discord 聊天都有语音聊天频道,但除非是计划好的聚会或活动,否则很少有人会在里面。

我们有时在 Discourse 聊天中也会遇到类似的情况。用户说“我们想要聊天”,我们就创建一个频道,然后他们说“大家都在哪儿?”,聊天最终的功能基本上就像一个人们偶尔访问的、意识流式的论坛主题。 (我们确实喜欢聊天,而且我们有一些铁杆的朋友群,他们更像是在手机上用它进行群发短信。) 发帖人的用户听起来就像在这样做,只是它就像通过语音信箱交流,这听起来并不好玩

正如之前建议的那样,这可能会自行解决,因为大多数用户可能感觉一样,如果你的语音回复者得不到回复,他们自然会停止这样做。

3 个赞

全球范围内,大多数人还不能使用。只是一个小小的提醒。

2 个赞

有趣的话题

我在 Android 上使用 gboard,并使用 Meta 应用进行语音转文本。我这样做是因为我天生是右撇子,现在右手不方便了,所以打字非常慢。

打字文本是一种在世界中位置不断变化的形式。我认为它的普及率会下降。人工智能已经能够进行语言翻译、语音转文本和文本转语音,因此搜索和广告中断等问题只是短期问题,很快就会变得无关紧要。

速度差异在于人们通常每分钟思考 600 到 800 个单词,而说话速度则在 200 个单词或更少。以 1.7 倍的速度重播音频对于仅收听来说是最佳的,因为人们的发音使得单词难以辨认,我怀疑人工智能处理很快就会消除这一障碍。

自动摘要、兴趣过滤器以及将兴趣与贡献匹配的其他形式(类似于 cookie 目前为广告商服务的方式)都只是过渡性的挑战。

语音和文本只是输入和输出的格式。因此,很快就会出现支持将文本/语音作为输出阅读器的选项,以及将语音文本作为输入选项——我相信这并不遥远。

并非每个论坛都像这个论坛一样经过审核,因此即使没有 AI 支持,收听每个帖子的需求也不是普遍的。我没有使用过 Apple,所以我不知道它的语音转文本功能,但 Android 上的 gboard 是免费的,任何能够访问基于讨论的论坛的人都离通用语音转文本(内置自然语言翻译)不远了。

这个话题是数字赋能社区演进中新范式开启的众多方式之一。

2 个赞