Reconocer texto automáticamente en imagen para texto alternativo

Aunque Discourse tiene una excelente función para editar descripciones de texto alternativo de imágenes en el panel de vista previa (para aquellos que desconfían de la edición de Markdown), en nuestra comunidad de más de 1800 personas, casi nadie escribe texto alternativo. El nombre del archivo es bastante inútil en mi opinión.

Sé que existe la esperanza/posibilidad de que la IA haga un primer borrador, y puedo verlo como una barra mínima, prefiero el texto alternativo escrito por humanos para que otros humanos con baja visión lo lean. No “resuelve” el problema, pero me pregunto sobre la capacidad que veo en Mastodon de tener una opción para OCR (reconocimiento óptico de caracteres) del texto de una imagen e insertarlo en el panel de edición.

Aquí he subido una imagen en Mastodon, que tiene texto, y estoy preparando mi texto alternativo.

Cuando hago clic en Detectar texto de la imagen, solo toma segundos para que se complete el campo de entrada de texto:

Puede ser necesaria una edición menor, pero ahorra mucho tiempo. Y es mejor que un lector de pantalla se encuentre con esto y diga “Screen Shot 59.jpg”.

5 Me gusta

¡Gracias!

Hice referencia a esta solicitud de funciones en el foro de OpenAI Discourse.

2 Me gusta

Estamos trabajando en una función que utilizará IA para generar descripciones de texto para imágenes, por lo que por ahora nos saltaremos el paso de OCR. ¡Lo anunciaremos en Meta cuando esté disponible!

7 Me gusta

La subtitulación ya está disponible en el plugin de IA: AI Image Captioning Feature in Discourse AI Plugin - #6

También vale la pena señalar que esto no es un reemplazo real de OCR:

2 Me gusta