Discourseチーム様
Discourseプラットフォームのアクセシビリティとエンゲージメントを大きく向上させる新機能を提案したいと思います。それは、トピックや返信で直接音声メッセージを録音・投稿するネイティブサポートと、自動音声テキスト変換機能です(InstagramやWhatsAppが提供しているものと同様)。この機能に関するプラグインやコンポーネントについての議論をいくつか見ましたが、現在利用可能なものは機能していないとのことでした。私自身はGitHubからプラグインをインストールして試すほどの専門知識がないため、有効/無効のトグルだけでシステムに組み込まれたネイティブツールがあれば、私のような一般ユーザーにとっては素晴らしいものになります。
なぜこの機能が必要なのか?
多くの人々にとって、タイピングは常に最も効果的またはアクセスしやすいコミュニケーション手段ではありません。これには以下のような人々が含まれます。
- タイピングが困難な障害や一時的な怪我を持つ人々。
- 識字レベルや快適さから話すことを好むコミュニティメンバー。
- より速く、ハンズフリーのコミュニケーションを求めるモバイルユーザー。
ユーザーがトピックや返信で直接音声(ボイスメモ)を録音・投稿できるようにすることで、参加の障壁が劇的に減り、Discourseコミュニティはより包括的なものになります。
なぜ文字起こしが重要なのか?
音声メッセージの自動文字起こしにより、オーディオを聴くことができないユーザー(例えば、聴覚障害のある場合や静かな環境にいる場合など)でも、プラットフォーム上のコンテンツを完全に理解し、参加できるようになります。
これをネイティブに統合すること(Instagram、WhatsApp、Googleメッセージなどが行っているように)は、Discourseプラットフォームを最先端の包括性とアクセシビリティ基準に近づけるでしょう。
これまでに行われた試み
以前のコミュニティソリューションをいくつか見ました。
しかし、これらのほとんどは、積極的にメンテナンスされていないか、完全に統合されていないか、文字起こし機能が欠けています。音声機能と統合された音声テキスト変換に対するコミュニティからの継続的な関心は明らかです。
推奨される機能
- トピックおよび返信のコンポーザーで、直接音声(ボイスメモ)を録音できるようにする。
- 代替手段として音声ファイルをアップロードできるようにする。
- 音声投稿ごとに文字起こしを自動生成して表示するために、音声テキスト変換サービスと統合する。
- 投稿前に文字起こしを編集または修正するオプション。
- 音声コンテンツを管理およびレビューするためのモデレーションコントロール。
結び
この機能は、多様なユーザーと状況をサポートする、包括的でモダンなプラットフォームとしてDiscourseを際立たせるでしょう。
ご検討ありがとうございます!私(およびコミュニティの他のメンバー)は、この方向へのいかなる動きも非常に楽しみにしています。
「いいね!」 7
個人的にはこれが大好きです。昨年手を骨折したのですが、Appleの音声入力はかなりうまく機能しますが、Discourseでも直接それができたらよかったのにと思います。とはいえ、個人的には話が長くなりがちです!
家族のフォーラムでもこれが欲しいです。そこでは、写真の共有やそれについての会話などが主に行われています。メッセージを録音して音声をキャプチャし、それを文字起こしできれば、まさに宝物です。
リクエストを簡潔に投稿していただきありがとうございます。
「いいね!」 3
pfaffman
(Jay Pfaffman)
3
これはコンピューター側で処理すべきことのように思えます。1つの音声入力システムの使い方を習得して機能させるだけでも大変なのに、使用するソフトウェアごとに異なるシステムがあるのはひどいでしょう。ブラウザ経由で複数のプラットフォームでの音声入力をサポートしようとするのも、現実的ではないように思えます。
フォーラムにアップロードされる前に、音声認識が実際に機能することを確認したいと思いませんか?音声認識は、自分の声に合わせてトレーニングできる自分のコンピューターの方がうまく機能するのではないでしょうか?
あらゆる種類のユーザーをサポートすることは賛成ですが、すべてのウェブアプリケーションが文字起こしを担当するのは理にかなっているとは思いません。私たちは、Discourseが視覚障碍者にテキストを読み上げることを期待していません。Discourseは、ユーザーが選択したアプリケーションが連携できるHTMLを提供します。
「いいね!」 6
アクセシビリティはユースケースの1つ(おそらく主なもの)ですが、唯一のものではありません。
フォーラムは有意義な交流を促進し、コミュニティを構築することを目的としているため、思考を共有するための方法を複数提供することは価値があるように思えます。開発の観点からどれほど複雑になるか、または労力に見合う価値があるかはわかりませんが、WhatsAppグループで人々が簡単に自己表現できるのは、ボイスメモを録音するオプションがすぐそこにあるからだと常に考えています。トピックやカテゴリによって会話をより整理できるフォーラムで、同様のものがあれば素晴らしいでしょう。
私自身、Instagramのボイスメモを再生する代わりに文字起こしする機能をよく利用しています。ヘッドフォンを使いたくないとき、電話を耳に当てたくないとき、または音声を出力したくないときに便利です。フォーラムで同様のオプションがあれば、ボイスメモははるかに実用的になります。そして個人的なものになります。
もちろん、フォーラムは読んだり書いたりするのが好きではない人、あるいは文字起こしされたテキストをコピー&ペーストするためだけにアプリを切り替えるのが面倒だと感じる人向けに設計されているわけではありません。しかし、私の場合、フォーラムのほとんどの人はコンピューターからではなく、モバイルデバイスからDiscourseにアクセスしています。これにより、参加の方法やタイミングが変わると思います。多くの人は、その瞬間にあまり入力できないという理由だけで、投稿を諦めてしまうかもしれません。話してボイスメモを投稿できること、あるいはさらに良いことに、音声をテキストに文字起こしして後で編集できることは、大きな違いを生むでしょう。
一方で、ボイスメモはモデレーションをより困難にするため、これは皆で考えなければならないことです。可能な限り多くの異なるユーザーシナリオを考慮する必要があります。
「いいね!」 2
pfaffman
(Jay Pfaffman)
5
おおお。あなたの言う通りです。
なるほど。私が年をとっているからです。コンピューターに話しかけるのが嫌なのです。たとえ、携帯電話のキーボードを必死に叩き続けるよりも明らかに速いとしても。
オーディオファイルを録音またはアップロードして、それを文字起こしできるインターフェースがあれば、それほど難しくないはずです。テーマコンポーネントでアップロード部分を処理でき、既存のAIプラグインで文字起こしを処理できるかもしれません。(そして面白いことに、私は過去2〜3週間、オープンソースの文字起こしツールに取り組んできました!)
「いいね!」 5
Jagster
(Jakke Lehtonen)
6
まあ、録音は実際には新しいリクエストではなく、以前は正しく機能させるのがかなり困難でした。しかし、フォーラムは写真やビデオを撮らないので、音声も同じであるべき、またはそうであるべき理由はなぜでしょうか?私たちは皆、それを行うことができるデバイスを持っており、残りは単に素晴らしいプレーヤーです🤔
「いいね!」 2
フォーラムでは、一般的に他人が作成した画像を共有しますが、ボイスノートには通常、より個人的な方法であなた自身の声が含まれます。少なくとも、それが目的です。
自分で写真、動画、ボイスノートを作成する労力は大きく異なります。そして、ボイスノートは通常、考えを共有するための最も迅速かつ直接的な方法です。写真の撮影や選択、動画の録画とアップロードには、多くの場合、より多くの手順が必要です。
しかし、オーディオ、特にすでに使用しているツールに機能が組み込まれている場合、話して送信するだけで済みます。これは貢献への障壁が低いため、フォーラム設定でそのオプションを持つことに価値があると考えています。
オーディオのみでは、モデレーションや検索の課題が生じる可能性があるため、文字起こし機能があり、オーディオとテキストの両方を持つことにも、さらに価値があると考えています。
「いいね!」 6
Cortrah
(Cortlandt Winters)
8
Suelenさんのアイデアに賛成です。私の妻と彼女の姉妹はパーキンソン病を患っており、すべてのメッセージやメールの送信にSiriを使用しています。私は毎日、彼女たちの使用状況の詳細を観察し、それについて考え、健常者が音声でソフトウェアとより良く対話する方法を考えています。
Discourseは多くの点で優れていますが、古いBBSシステムとの主な差別化要因は、スマートフォンやタブレットだけでなく、ブラウザでもうまく機能することです。そして、スマートフォンは主に音声デバイスです。
もし私がDiscourseが2030年から2035年にかけて必要とされるもののためのテストスイートを作成するとしたら、スマートフォンでDiscourseサイトにアクセスし、音声だけでコミュニティをナビゲートできる機能を含めるでしょう。理想的には、音声と音声、そして要求されたときにテキスト読み上げでコンテンツを読み上げることによって、カテゴリやスレッドをナビゲートできるはずです。
AIよりもはるかに重要で、実行もはるかに簡単です。そして、すべてのデバイスには独自の音声認識と誤字訂正の方法がありますが、できることなら、これらのシステムが良い、無料、または一貫していることに依存したくはありません。
Discourseには多くの機能があるため、これは非常に大きな機能となるでしょう。文字起こしのコストがどのようになるか興味がありますが、これは非常に価値のある提案だと思います。
「いいね!」 1
Jagster
(Jakke Lehtonen)
9
私たちには、基本的に、そして実際には、それらを使用するだけで必要なツールがすでにあります。私はこのテキストをフィンランド語で話しました。その後、AIがそれを英語に翻訳し、すべてうまくいきました。
「いいね!」 1