Reconhecer automaticamente texto em imagem para Alt-Text

Embora o Discourse tenha um recurso elegante para editar descrições de texto alternativo de imagens na área de visualização (para aqueles que desconfiam da edição de Markdown), em nossa comunidade de mais de 1800 pessoas, quase ninguém escreve texto alternativo. O nome do arquivo é praticamente inútil, na minha opinião.

Sei que há esperança/possibilidade de a IA fazer um primeiro rascunho, e vejo isso como um mínimo, mas prefiro texto alternativo escrito por humanos para que outros humanos com baixa visão possam ler. Isso não “resolve” o problema, mas me pergunto sobre a capacidade que vejo no Mastodon de ter uma opção para OCR (reconhecimento óptico de caracteres) do texto de uma imagem e inseri-lo na área de edição.

Aqui, fiz o upload de uma imagem no Mastodon que contém texto, e estou me preparando para escrever meu texto alternativo.

Quando clico em Detectar texto da imagem, leva apenas alguns segundos para preencher o campo de entrada de texto:

Pode ser necessária uma edição menor, mas economiza muito tempo. E é melhor do que um leitor de tela encontrar isso e dizer “Screen Shot 59.jpg”.

5 curtidas

Obrigado!

Referenciei esta solicitação de recurso no fórum OpenAI Discourse.

2 curtidas

Estamos trabalhando em um recurso que usará IA para gerar descrições de texto para imagens, então estamos pulando a etapa de OCR por enquanto. Anunciaremos no Meta assim que estiver disponível!

7 curtidas

A legendagem agora é uma opção disponível no plugin de IA: AI Image Captioning Feature in Discourse AI Plugin - #6

Vale também notar que esta não é uma substituição real de OCR:

2 curtidas