画像内のテキストを自動認識して代替テキストに

Discourse にはプレビューペインで代替テキストの画像の説明を編集できる洗練された機能がありますが(Markdown編集を避けたい人向け)、1800人以上のコミュニティではほとんど誰も alt-text を書いていません。私の考えでは、ファイル名はほとんど役に立ちません。

AI が最初の草稿を作成できる希望/可能性があることは知っています。それは最低限の基準として理解できますが、他のロービジョンの人々に読んでもらうためには、人間が作成した alt テキストを好みます。それは問題を「解決」しませんが、Mastodon にある、画像からテキストを OCR して編集ペインに挿入するオプションを有効にする機能について疑問に思っています。

ここでは、テキストを含む画像が Mastodon にアップロードされており、Alt テキストを作成する準備をしています。

「画像からテキストを検出」をクリックすると、テキスト入力フィールドが数秒で入力されます。

マイナーな編集が必要な場合もありますが、多くの時間を節約できます。そして、スクリーンリーダーがこれを読み上げて「Screen Shot 59.jpg」と言うよりも優れています。

「いいね!」 5

ありがとうございます!

OpenAI Discourseフォーラムでこの機能リクエストを参照しました。

「いいね!」 2

AIを使用して画像の説明文を生成する機能に取り組んでいるため、現時点ではOCR(光学文字認識)のステップはスキップします。利用可能になったらMetaで発表します!

「いいね!」 7

AIプラグインでキャプション機能が利用可能になりました: AI Image Captioning Feature in Discourse AI Plugin - #6

これは真のOCRの代替ではないことも注目に値します:

「いいね!」 2