您好,Discourse 团队:
我想建议一项新功能,该功能将极大地提升 Discourse 平台的无障碍性和参与度:原生支持直接在主题和回复中录制和发布音频消息,并附带自动语音转文字转录功能(类似于 Instagram 和 WhatsApp 提供的功能)。我看到了一些关于此功能的插件和组件的讨论,包括目前可用的插件无法正常工作的相关信息。由于我没有专业知识来安装 GitHub 上的插件并进行尝试,因此一个内置于系统中的原生工具,只需一个启用/禁用开关,对像我这样的普通用户来说将是极好的。
此功能为何重要?
对许多人来说,打字并非总是最有效或最易于访问的沟通方式。这可能包括:
- 有残疾或暂时性损伤,导致打字困难的人。
- 因识字水平或习惯而更喜欢说话的社区成员。
- 希望实现更快、免提通信的移动用户。
允许用户直接录制和发布音频(语音便笺),包括在评论中,将大大降低参与门槛,使 Discourse 社区更具包容性。
转录为何重要?
语音消息的自动转录将确保所有用户——包括那些无法收听音频的用户(例如,由于听力障碍或在安静的环境中)——仍然能够参与并充分利用平台上的内容。
将其原生集成(如 Instagram、WhatsApp 或 Google Messages 所做的那样),将使 Discourse 平台更接近最先进的包容性和无障碍性标准。
目前已尝试过什么?
我看到之前有一些社区解决方案:
然而,其中大多数要么没有积极维护,要么没有完全集成,要么缺乏转录功能。社区对音频功能和集成语音转文字有着明确的持续兴趣。
建议的功能
结语
此功能将使 Discourse 成为一个包容、现代的平台,支持各种用户和场景,从而脱颖而出。
感谢您的考虑!我(以及社区中的其他人)将非常期待看到这方面取得任何进展。
7 个赞
我个人很喜欢这个功能。我去年摔断了手,虽然苹果的听写功能效果很好,但我希望也能直接在 Discourse 中使用。不过,我个人在听写时有点啰嗦!
我也希望我的家庭论坛能有这个功能,我们会在论坛上分享和讨论照片等内容。能够录制一条消息,捕捉声音,然后将其转录出来,那将是无价之宝。
感谢您如此简洁地发布了这个请求。
3 个赞
pfaffman
(Jay Pfaffman)
3
这似乎是应该在计算机方面处理的事情。学习使用一个听写系统并使其正常工作似乎已经够难了。在使用的每种软件上都有一个不同的系统似乎会很糟糕。试图通过浏览器支持跨多个平台的听写似乎也是不可行的。
您难道不想在上传到论坛之前看到语音转文本确实有效吗?语音转文本在您自己的计算机上是否效果更好,因为它可以根据您自己的声音进行训练?
我全力支持所有类型的用户,但我不知道为什么每个 Web 应用程序都应该负责转录。我们不期望 Discourse 为盲人朗读文本,Discourse 提供 HTML,用户可以选择的应用程序可以与之配合。
6 个赞
可访问性是一个用例(可能是主要的用例),但并非唯一用例。
由于论坛旨在促进有意义的互动和建立社区,因此提供多种分享想法的方式似乎很有价值。我不知道从开发角度来看这有多复杂,或者是否值得付出努力,但我一直在想,人们在 WhatsApp 群组中表达自己是多么容易,仅仅因为录制语音消息的选项就在那里。在论坛中拥有类似的功能将是极好的,因为论坛可以按主题和类别更好地组织对话。
我自己经常使用 Instagram 的功能,该功能可以转录语音消息而不是播放它们。当我不想使用耳机、将手机贴近耳朵或大声播放音频时,这非常方便。在论坛中拥有类似的功能将使语音消息更加实用。而且更具个性化。
当然,论坛并非专为不喜欢阅读或写作,或者觉得切换应用程序只是为了复制和粘贴转录文本太麻烦的人设计的。但在我的例子中,论坛上的大多数人都是通过移动设备访问 Discourse,而不是通过电脑。我设想这会改变他们参与的方式和时间。许多人可能会放弃发帖,仅仅因为他们当时无法输入太多内容。能够说出并发布语音消息,或者更好的是,将语音转录为文本并在之后进行编辑,将会产生很大的不同。
另一方面,语音消息使审核更具挑战性,因此我们需要集体思考这一点,并尽可能多地考虑不同的用户场景。
2 个赞
pfaffman
(Jay Pfaffman)
5
哦哦哦。你说得对。
我明白了。这是因为我老了。我就是讨厌和电脑说话。即使这显然比我坚持在手机键盘上涂鸦要快得多。
拥有一个允许你录制或上传音频文件然后进行转录的界面应该不难。我认为一个主题组件可以处理上传部分,也许现有的 AI 插件可以处理转录。 (有趣的是,在过去的几周里,我一直在研究一个开源的转录工具!)
5 个赞
Jagster
(Jakke Lehtonen)
6
嗯,录音并不是一个新需求,而且之前要让它正常工作还相当困难。但是——论坛不能拍照片或视频,那音频有什么理由应该或会不同呢?我们都有可以做到这些的设备,剩下的就是一个不错的播放器了 
2 个赞
好吧,我明白你的观点,但这并不是完全相同的媒介性质。
在论坛上,我们通常分享的是别人创作的图片,但语音笔记通常包含你自己的声音,方式更个人化。至少这是目标。
制作自己的照片、视频和语音笔记所付出的努力是截然不同的——而语音笔记通常是分享想法最快捷、最直接的方式。拍摄或选择照片,或者录制和上传视频,通常需要更多的步骤。
但对于音频来说,尤其是如果该功能嵌入在你已经使用的工具中,你就可以直接说话并发送。这降低了参与的门槛,这就是为什么我认为在论坛环境中拥有该选项是有价值的。
我甚至认为转录并同时拥有音频和文本的功能更有价值,因为纯音频可能会带来审核和搜索方面的挑战。
6 个赞
Cortrah
(Cortlandt Winters)
8
我赞同 Suelen 的想法。我妻子和她的妹妹患有帕金森病,她们通过 Siri 发送每一条消息和电子邮件。我每天都会观察和思考她们使用细节,并思考非残疾人士如何通过语音更好地与软件互动。
虽然 Discourse 在许多方面都很棒,但它与旧的 BBS 系统相比,主要区别在于它在手机和平板电脑以及浏览器上都能很好地运行。而手机主要是语音设备。
如果我要为 Discourse 在 2030-35 年需要具备的功能创建一个测试套件,它将包括能够通过手机访问 Discourse 网站并仅通过声音浏览社区。理想情况下,人们可以通过纯粹的语音和音频导航其类别和主题,并在请求时通过文本转语音朗读内容。
这比人工智能重要得多,也容易得多。虽然每台设备都有自己的语音转文本和纠错方式,但如果你能做到的话,你不希望依赖这些系统的好坏、免费或一致性。
这将是一个巨大的功能,因为 Discourse 有很多内容,而且我对转录的成本感到好奇,但我认为这是一个非常值得研究的建议。
1 个赞
Jagster
(Jakke Lehtonen)
9
我们基本上已经拥有了所需的工具,而且在实践中也是如此,只要我们使用它们。我用芬兰语说了这段话。之后,AI 将其翻译成英语,一切都很好。
1 个赞