为Alt-Text自动识别图片中的文本

尽管 Discourse 有一个很棒的功能,可以在预览窗格中编辑替代文本图像描述(对于那些不熟悉 Markdown 编辑的人来说),但在我们 1800 多人的社区中,几乎没有人编写 alt-text。在我看来,文件名几乎没有用。

我知道 AI 有希望/可能进行初步处理,我可以看到这可以作为最低标准,但我更喜欢由人类编写的 alt-text,供其他低视力人类阅读。这并不能“解决”问题,但我想知道 Mastodon 中是否存在一个选项,可以 OCR 图像中的文本并将其插入编辑窗格。

在这里,我在 Mastodon 上传了一张包含文本的图片,并准备编写我的 Alt 文本。

当我点击 Detect text from picture(从图片中检测文本)时,只需几秒钟即可填充文本输入字段:

可能需要进行少量编辑,但这可以节省大量时间。这比屏幕阅读器遇到这个并说“Screen Shot 59.jpg”要好。

5 个赞

谢谢!

已在 OpenAI 论坛上引用此功能请求。

2 个赞

我们正在开发一项将使用人工智能为图像生成文本描述的功能,因此我们暂时跳过了 OCR 步骤。一旦可用,我们将在 Meta 上宣布!

7 个赞

AI 插件现已提供字幕功能:AI Image Captioning Feature in Discourse AI Plugin - #6

另外值得注意的是,这并非真正的 OCR 替代品:

2 个赞