Автоматическое распознавание текста на изображении для Alt-Text

Хотя в Discourse есть удобная функция редактирования альтернативного текста (описаний изображений) в панели предпросмотра (для тех, кто опасается работы с Markdown), в нашем сообществе из более чем 1800 человек практически никто не пишет альтернативный текст. Имя файла в моей книге почти бесполезно.

Я знаю, что есть надежда/возможность использовать ИИ для первичной обработки, и я могу видеть в этом некоторый минимальный порог, но я предпочитаю альтернативный текст, написанный человеком, для чтения другими людьми с низким зрением. Это не «решает» проблему, но меня интересует возможность, которую я вижу в Mastodon: наличие опции для распознавания текста с изображения (OCR) и его вставки в панель редактирования.

Здесь я загрузил изображение в Mastodon, которое содержит текст, и готовлюсь написать свой альтернативный текст.

Когда я нажимаю Распознать текст с картинки, текстовое поле заполняется за считанные секунды:

Может потребоваться небольшая правка, но это экономит много времени. И это лучше, чем когда скринридер натыкается на это и произносит «Screen Shot 59.jpg».

5 лайков

Спасибо!

Ссылка на запрос функции на форуме OpenAI Discourse.

2 лайка

Мы работаем над функцией, которая будет использовать ИИ для генерации текстовых описаний изображений, поэтому пока мы пропускаем этап OCR. О запуске мы сообщим в Meta, когда функция будет доступна!

7 лайков

Функция подписей теперь доступна в плагине AI: AI Image Captioning Feature in Discourse AI Plugin - #6

Также стоит отметить, что это не полноценная замена OCR:

2 лайка