Automatische Texterkennung in Bildern für Alt-Text

Obwohl Discourse eine ausgefeilte Funktion zum Bearbeiten von Alternativtext-Bildbeschreibungen im Vorschaufenster hat (für diejenigen, die beim Bearbeiten von Markdown vorsichtig sind), schreibt in unserer Community von über 1800 Mitgliedern fast niemand Alt-Texte. Der Dateiname ist in meinen Augen so gut wie nutzlos.

Ich weiß, dass es Hoffnung/Möglichkeit gibt, dass KI einen ersten Entwurf erstellt, und ich sehe das als eine Mindestanforderung, aber ich bevorzuge von Menschen verfasste Alt-Texte für andere sehbehinderte Menschen zum Lesen. Es „löst“ das Problem nicht, aber ich frage mich nach der Möglichkeit, die ich in Mastodon sehe, eine Option zu haben, den Text aus einem Bild per OCR zu erkennen und in das Bearbeitungsfeld einzufügen.

Hier habe ich ein Bild in Mastodon hochgeladen, das Text enthält, und bereite mich darauf vor, meinen Alt-Text zu schreiben.

Wenn ich auf Text aus Bild erkennen klicke, dauert es nur Sekunden, bis das Textfeld gefüllt ist:

Geringfügige Bearbeitungen können erforderlich sein, aber es spart viel Zeit. Und es ist besser, als wenn ein Screenreader auf „Screen Shot 59.jpg“ stößt und dies vorliest.

5 „Gefällt mir“

Danke!

Habe diese Funktionsanfrage im OpenAI Discourse Forum referenziert.

2 „Gefällt mir“

Wir arbeiten an einer Funktion, die KI zur Generierung von Textbeschreibungen für Bilder nutzen wird, daher überspringen wir vorerst den OCR-Schritt. Wir werden sie auf Meta ankündigen, sobald sie verfügbar ist!

7 „Gefällt mir“

Bildunterschriften sind jetzt eine verfügbare Option im KI-Plugin: AI Image Captioning Feature in Discourse AI Plugin - #6

Es ist auch erwähnenswert, dass dies kein echter OCR-Ersatz ist:

2 „Gefällt mir“