Converti immagine in testo

vainaixr · 20 Settembre 2022, 5:56am

Le persone pubblicano screenshot, ci potrebbe essere un modo per estrarre il testo da un’immagine e aggiungerlo in fondo al post

Jagster · 20 Settembre 2022, 5:59am

Certo. Google OCR.

Ma non da Discourse. E immagino che una funzionalità del genere non arriverà comunque molto presto

merefield · 20 Settembre 2022, 6:27am

Probabilmente dovresti creare un plug-in o creandolo tu stesso o ingaggiando un freelancer Marketplace

michaeld · 20 Settembre 2022, 6:36am

Vedi questo plugin

Il cliente (@csmu) non mi ha mai pagato, tra l’altro

Tris20 · 1 Febbraio 2023, 10:37am

Ciao @michaeld

Scorrendo rapidamente questo plugin, ho capito bene che le immagini vengono inviate ai server di Google per l’elaborazione? Qual è stato il ragionamento per questo approccio piuttosto che utilizzare una gemma Ruby per elaborare localmente o sul server dell’istanza di Discourse? Sono interessato a questo argomento, ma l’invio di immagini esterne non è un’opzione.

michaeld · 1 Febbraio 2023, 10:58am

Prestazioni migliori, facilità di manutenzione, evitando dipendenze di versione sull’installazione locale.

Capisco che questo non sia sempre un approccio accettabile. Una PR è benvenuta, anche se l’utente dovrebbe sempre essere in grado di evitare un inferno di dipendenze locali.

Tris20 · 1 Febbraio 2023, 12:16pm

Interessante. Immagino che questo si sia concentrato principalmente sulla scrittura a mano, giusto? Se si trattasse semplicemente di estrarre testo da un’immagine, ad esempio uno screenshot di errore, allora suppongo che una gemma locale potrebbe essere abbastanza accurata. Ho giocato con una libreria Python per qualcosa di simile un po’ di tempo fa e ho ottenuto risultati ragionevoli. A volte era spazzatura, ma i risultati non sarebbero mai stati letti dalla community, solo dal motore di ricerca. Se l’utente notasse qualcosa di sciocco, potrebbe sempre modificare il testo nascosto.

michaeld · 1 Febbraio 2023, 12:43pm

Non voglio risultati ragionevoli, voglio risultati eccellenti.

Jagster · 1 Febbraio 2023, 12:52pm

Non esiste un OCR che possa offrire risultati eccellenti. Anche risultati ragionevoli possono essere difficili da ottenere, indipendentemente dalla libreria utilizzata.

Ed_S · 1 Febbraio 2023, 10:54pm

Tieni presente che l’OCR spesso funziona su schermate, non su scansioni o foto. Non sarà comunque al 100%, ma è un buon tipo di testo da provare a riconoscere.

Noto che l’interfaccia Web di Mastodon offre una funzione OCR nella finestra di dialogo in cui è possibile inserire una descrizione dell’immagine per motivi di accessibilità. Potrebbe essere che venga eseguita lato server. Ecco come appare, dopo aver fatto clic su “Rileva testo dall’immagine”:

Tris20 · 9 Febbraio 2023, 3:27pm

Interessante. Sembra che abbia risultati simili a Tesseract. Mi chiedo come lo strumento Mastodon gestisca immagini con grafica e testo?

Un nobile obiettivo Mentre condivido il desiderio di risultati eccellenti, sarò felice con un miglioramento dell’80%

Nel contesto che ho in mente, l’obiettivo è estrarre cose come messaggi di errore dagli screenshot. Ad esempio, se un utente ha un registro degli errori nel suo terminale, la tendenza è semplicemente di fare uno screenshot. Anche se il risultato non è perfetto, se estrae circa l’80% del testo correttamente, allora qualcuno che cerca il messaggio di errore, o un altro pezzo di testo correlato, ha una probabilità molto più alta di trovare l’Argomento, rispetto a se fosse solo l’immagine non ricercabile.

Argomento		Risposte	Visualizzazioni
Transcribing handwritten text in images plugin Marketplace	6	926	Settembre 28, 2021
Ai plugin ocr support Feature ai	11	966	Aprile 2, 2024
Adding a picture questions feature Feature ai	3	838	Gennaio 12, 2024
Autorecognize text in image for Alt-Text Feature	3	672	Febbraio 22, 2024
Introduce alt-text for images on chat Feature chat	0	369	Febbraio 22, 2023

Converti immagine in testo

Argomenti correlati