Riconoscimento automatico del testo nelle immagini per Alt-Text

Sebbene Discourse disponga di un’ottima funzionalità per modificare le descrizioni alternative delle immagini nella finestra di anteprima (per coloro che sono restii a modificare il Markdown), nella nostra community di oltre 1800 persone quasi nessuno scrive testo alternativo. Il nome del file è praticamente inutile, secondo me.

So che c’è speranza/possibilità che l’IA possa fare un primo tentativo, e lo vedo come un requisito minimo, ma preferisco il testo alternativo scritto da un essere umano per altri ipovedenti. Non “risolve” il problema, ma mi chiedo riguardo alla funzionalità che vedo in Mastodon di avere un’opzione per eseguire l’OCR del testo da un’immagine e inserirlo nel riquadro di modifica.

Qui ho caricato un’immagine in Mastodon, che contiene testo, e mi sto preparando a scrivere il mio testo alternativo.

Quando clicco su Rileva testo dall'immagine, ci vogliono solo pochi secondi per popolare il campo di inserimento del testo:

Potrebbe essere necessaria una piccola modifica, ma fa risparmiare molto tempo. Ed è meglio che uno screen reader si imbatta in questo e dica “Screen Shot 59.jpg”.

5 Mi Piace

Grazie!

Ho fatto riferimento a questa richiesta di funzionalità sul forum OpenAI Discourse.

2 Mi Piace

Stiamo lavorando a una funzionalità che utilizzerà l’IA per generare descrizioni testuali per le immagini, quindi per ora salteremo il passaggio OCR. Lo annunceremo su Meta non appena sarà disponibile!

7 Mi Piace

La didascalia è ora un’opzione disponibile nel plugin AI: AI Image Captioning Feature in Discourse AI Plugin - #6

Vale anche la pena notare che questa non è una vera sostituzione dell’OCR:

2 Mi Piace