为Alt-Text自动识别图片中的文本

cogdog · 2024 年1 月 25 日 23:25

尽管 Discourse 有一个很棒的功能，可以在预览窗格中编辑替代文本图像描述（对于那些不熟悉 Markdown 编辑的人来说），但在我们 1800 多人的社区中，几乎没有人编写 alt-text。在我看来，文件名几乎没有用。

我知道 AI 有希望/可能进行初步处理，我可以看到这可以作为最低标准，但我更喜欢由人类编写的 alt-text，供其他低视力人类阅读。这并不能“解决”问题，但我想知道 Mastodon 中是否存在一个选项，可以 OCR 图像中的文本并将其插入编辑窗格。

在这里，我在 Mastodon 上传了一张包含文本的图片，并准备编写我的 Alt 文本。

当我点击 Detect text from picture（从图片中检测文本）时，只需几秒钟即可填充文本输入字段：

可能需要进行少量编辑，但这可以节省大量时间。这比屏幕阅读器遇到这个并说“Screen Shot 59.jpg”要好。

EricGT · 2024 年1 月 26 日 11:33

谢谢！

已在 OpenAI 论坛上引用此功能请求。

awesomerobot · 2024 年1 月 26 日 18:28

我们正在开发一项将使用人工智能为图像生成文本描述的功能，因此我们暂时跳过了 OCR 步骤。一旦可用，我们将在 Meta 上宣布！

awesomerobot · 2024 年2 月 22 日 18:12

另外值得注意的是，这并非真正的 OCR 替代品：

话题		回复	浏览量
Encourage/enforce adding image descriptions Feature composer , ai	20	2488	2026 年1 月 14 日
Editing image alternative (alt) text Announcements new-feature	4	1597	2022 年6 月 11 日
Automatically add a relevant alt image attribute Feature	12	1406	2024 年4 月 8 日
Convert image to text Feature	10	1629	2023 年2 月 9 日
Introduce alt-text for images on chat Feature chat	0	366	2023 年2 月 22 日