KI-generierte Tag-Übersetzungen funktionieren nicht perfekt

Beim Durchscrollen der deutschen Tag-Übersetzungen sind mir verschiedene Probleme aufgefallen, die darauf hindeuten, dass die KI den Kontext nicht versteht – sie behandelt Tags als isolierte Wörter, statt sie als Verweise auf spezifische Discourse-Funktionen, Plugins oder Komponenten zu erkennen.

Hinweis: Deutsche Substantive werden immer großgeschrieben, Tags auf Meta sind jedoch kleingeschrieben. Die Übersetzungen in diesem Beitrag sind daher inkonsistent großgeschrieben – ich bin aus Gewohnheit immer wieder in die korrekte deutsche Großschreibung verfallen.

Zuerst der unterhaltsame Teil

Bevor wir zu den praktischen Problemen kommen, sind einige Übersetzungen einfach nur amüsant:

  • composer → „Komponist“ – Das ist die Person, die Musik schreibt
  • auto-bump → „automatische-erhöhung“ – „automatische Erhöhung“
  • fully-theme → „vollständig-thematisiert“ – „vollständig behandelt“
  • raspberry-pi → „Himbeere-pi“ („raspberry“ wie die Frucht)
  • post-voting → „nach-der-Abstimmung“ – „nach der Abstimmung“ („post“ wurde als lateinisches Präfix gelesen, nicht als Forum-Beitrag)
  • tablet → „Tablette“ – „Pille“ (das Medikament, nicht das Gerät)

Gleiche Übersetzung für verschiedene Tags

Dies ist das problematischste Issue in der Praxis. Wenn zwei Tags die gleiche Übersetzung erhalten, verlieren sie ihre Fähigkeit, Themen voneinander zu unterscheiden.

  • year-in-review & yearly-review → „Jahresrückblick“ – Derzeit scheint der Plugin-Name nicht übersetzbar zu sein (im Admin-Sidebar und in der Liste der installierten Plugins sehe ich den englischen Namen), daher ist es wahrscheinlich, dass man den englischen Begriff verwenden würde, um auf den Namen des Plugins zu verweisen. Ich hoffe jedoch, dass eines Tages alle Plugins übersetzte Namen haben, daher würde ich wahrscheinlich „Metas“ zu dem Tag hinzufügen, der die Jahresrückblick-Themen hier gruppiert, um sie zu trennen, also „Metas-Jahresrückblick“ (Jahresrückblick der Metas).
  • surveys & polls → „Umfragen“ – Ich denke, die Übersetzungen beider Plugins sind ebenfalls identisch, und bisher hat es niemand bemerkt. Ich muss noch über eine gute Lösung dafür nachdenken, da dies auch leicht mit „Abstimmung“ kollidieren kann :exploding_head:
  • docs & documentation → „Dokumentation“ – Genau wie bei yearly-review wurde docs nicht ins Deutsche übersetzt, daher würde ich auch das Tag nicht übersetzen (Eine Übersetzung in der Zukunft scheint in diesem Fall sehr unwahrscheinlich).
  • how-to & tutorial → „Anleitung“ – Dies wurde bereits behoben. Ich habe diese Übersetzung von https://diataxis.fr/ gefunden und den dort verwendeten Begriff[1] vorgeschlagen).

Eigennamen und Produktnamen, die nicht übersetzt werden sollten

Einige Tags beziehen sich auf bestimmte Tools, Frameworks oder Produkte. Ihre Übersetzung macht die Funktion unerkennbar.

  • raspberry-pi → „Himbeere-pi“ („raspberry“ wie die Frucht)
  • mermaid → „Meerjungfrau“ („mermaid“ wie das mythologische Wesen, nicht das Diagramm-Tool)
  • ember → „Glut“ (glühende Holzkohle aus einem Feuer)
  • vanilla → „Vanille“ (der Geschmack)
  • onebox → „einzige-box“ – „einziges Feld“
  • intercom → „Gegensprechanlage“ (eine Gegensprechanlage wie eine Türklingel – obwohl intercom-widget korrekt übersetzt wurde)
  • passkey → „Passwort“ – „Passwort“ (ein Passkey ist spezifisch kein Passwort)
  • perspective-api → „Perspektiven-api“
  • backups → „Sicherungen“
  • design-experiment → „Experimententwurf“ – kann „design-experiment“ sein, aber auch „Entwurfs-Experiment“. Ich würde an Letzteres denken, da ich für Ersteres „design“ beibehalten hätte und das Sprechen über Entwürfe in Discourse quite üblich ist.

Übersetzungen von „Discourse“

Die meisten Tags, die sich auf „Discourse“ beziehen, wurden so übersetzt, dass sie den Namen der Software nicht mehr enthalten. Eine Ausnahme ist discourse-hub .

„Theme“ wird konsequent als „Thema“ (topic) falsch übersetzt

Dies ist ein systematisches Problem bei allen themenbezogenen Tags. Auf Deutsch werden sowohl „theme“ als auch „topic“ mit Thema übersetzt, aber im Discourse-Kontext sind dies sehr unterschiedliche Dinge. Dies lässt Theme-Tags so aussehen, als ob sie von spezifischen Diskussionsthemen handeln würden.

Dies betrifft alle Tags in der Gruppe Official Themes.

Übersetzungen, bei denen der Kontext fehlte

  • composer → „Komponist“ – Das ist die Person, die Musik schreibt, im Vergleich zum Eingabefeld, das wir im Deutschen normalerweise „Editor“ nennen.
  • tablet → „Tablette“ – „Pille“ oder „Tablette“.
  • copy-post → „kopierbeitrag“ – „Kopiergebühr“ (Das Problem ist die Kombination der Wörter. „Beitrag“ für post ist korrekt, aber weil copy nicht als Verb übersetzt wurde, liest es sich, als würde Beitrag hier in der Bedeutung von Gebühr verwendet).

Nomen oder Verb

Einige Funktionen wurden als Verben statt als Nomen übersetzt

  • chat → „plaudern“ – „plaudern“
  • search → „suchen“ – „suchen“

„post“ wurde als lateinisches Präfix gelesen, nicht als Forum-Beitrag

  • post-voting → „nach-der-Abstimmung“ – „nach der Abstimmung“
  • post-badges → „nach-Abzeichen“ – „nach-Abzeichen“

Ergebnisse aus nicht ganz klaren englischen Tags

  • hosted-support → „gehosteter-support“ (Das liest sich so, als ob der Support gehostet wäre, anstatt Support für gehostete Kunden)

Abkürzung

  • pm-dropdown (im Deutschen gleich) ohne Kontext wurde m (message) nicht durch n (Nachricht) ersetzt.

Übersetzungen, die nicht zur eigenen Terminologie von Discourse passen

Diese Übersetzungen sind technisch korrektes Deutsch, aber Discourse’s eigene Benutzeroberfläche verwendet andere Begriffe. Dies macht es schwieriger, Tags intuitiv zu finden, insbesondere für Benutzer, die sich anhand der Sprachauswahl der Oberfläche navigieren.

  • impersonate → „nachahmen“ – „imitieren“ (aber die Oberfläche verwendet Nutzersicht oder Nutzerrolle)
  • staged-users → „Staging-Benutzer“ (aber die Oberfläche sagt vorbereitete Benutzer)
  • advertising → „Werbung“ (aber die Oberfläche bezieht sich auf Anzeigen)
  • assign → „zuweisen“ (aber die Plugin-Übersetzung verwendet zuordnen)
  • hot-topics → „Top-Themen“ (dies wurde als „top topics“ übersetzt, was in Discourse eigentlich eine andere Liste ist)
  • read-only → „nur lesbar“
  • bootstrap-mode → „Bootstrap-Modus“ (aber die Übersetzer haben ursprünglich Starthilfemodus gewählt)
  • post-notices → „Nachrichten“ – „Nachrichten/Neuigkeiten“ (kann irreführend sein, da Nachrichten eine andere Funktion sind, „official notice“ verwendet in der Oberfläche Mitteilung)
  • about-page → „über-Seite“ (Dies ist eine wörtliche Übersetzung. Aber normalerweise ist die deutsche Übersetzung etwas wie „Über-uns-Seite“. Über bedeutet nicht nur about, sondern auch above.)
  • auto-bump → „automatische-erhöhung“ – „automatische Erhöhung“
  • tags → „Etiketten“ (aber tag-groups und die meisten Tags, die tag enthalten, verwenden „tag“, der auf Crowdin verwendete Begriff ist Schlagwort)

Abgeschnittene Übersetzungen

Dies ist eine andere Art von Problem – kein Übersetzungsfehler, sondern eine Konsequenz daraus, dass deutsche Komposita deutlich länger sind als ihre englischen Entsprechungen, kombiniert mit dem Zeichenlimit für Tags.

  • content-security-policy → „inhalts-sicherheitsrichtl“ (abgeschnitten, sollte inhalts-sicherheitsrichtlinie sein)
  • ai-custom-prompt → „ai-benutzerdefinierte-auf“ (abgeschnitten mitten im Wort, sollte ai-benutzerdefinierte-aufforderung sein)
  • custom-category-boxes → „benutzerdefinierte-katego“ (abgeschnitten mitten im Wort, sollte benutzerdefinierte-kategorie-boxen sein, in diesem Fall fehlt box komplett aus der Übersetzung)

Tags, die „custom“ enthalten, werden leicht zu lang, weil „benutzerdefiniert“ ein ziemlich langes Wort ist.

more examples

Diese Beispiele deuten darauf hin, dass der Übersetzungsprozess mehr Kontext benötigt – idealerweise das Wissen, zu welchem Plugin oder welcher Funktion ein Tag gehört, und den Zugriff auf bestehende Discourse-Oberflächenübersetzungen als Referenz. Ich freue mich zu hören, ob andere ähnliche Muster in anderen Sprachen bemerkt haben.


@nat (auf persönlichen Wunsch)


  1. Lernunterlagen ↩︎

8 „Gefällt mir“

Danke @Moin, ich werde mich damit befassen und unsere Prompts verbessern :smiling_face:

Außerdem LOL

Danke für die Lacher :hugs:

5 „Gefällt mir“

@nat, was wäre, wenn wir dem Agenten Zugriff auf das Lesetool geben, damit er den Kontext selbstständig sammeln könnte?

Für Beiträge wäre dies zu kostspielig, aber für einmalige Aufgaben wie Tags und Kategorien wäre es relativ günstig und würde die Qualität bei allen Modellen steigern.

4 „Gefällt mir“

Hmm, das ist eine gute Idee @falco.

Eine andere Möglichkeit, die ich in Betracht gezogen habe, bestand darin, die Beschreibung des Tags als zusätzlichen Kontext zu übergeben, wenn der Tag-Name übersetzt wird. Vielleicht ist diese Methode vorhersehbarer, was denkst du?

4 „Gefällt mir“

Der Zugriff auf das Glossar in Crowdin könnte für den Übersetzungs-Bot sehr hilfreich sein (nicht für alle Seiten, aber besonders für Meta). Wenn dort vermerkt ist, dass wir „composer" als „Editor" übersetzen und die KI dies weiß, könnte sie dies in Tags, aber auch in Themenüberschriften und Beiträgen verwenden.

Ich habe „composer" einmal in Introducing our new composer, making writing on Discourse easier than ever korrigiert, was mein Feedback zum Bearbeiten von Übersetzungen hier zur Folge hatte: Feedback on the composer when translating a post to German. Das Thema wurde jedoch nach meiner Korrektur bearbeitet, und es scheint, dass die vorherige Übersetzung nicht als Kontext verwendet wird, sodass im Beitrag erneut „composer" steht. (Der Komponist von Musik kommt in Beiträgen normalerweise nicht vor; nur kürzere Texte wie Themenüberschriften und Tags.)

Auf Meta fügt die Beschreibung oft nicht viel Kontext hinzu. Alle Beschreibungen für Theme-Komponenten enthalten beispielsweise lediglich einen Link zum Thema der Komponente, nicht aber die kurze Beschreibung aus dem Anfang des Themas.

Gute Idee, lass uns beides machen!

Die Idee ist, Meta als Testumgebung und Proxy für das zu nutzen, was unsere Kunden im echten Einsatz erleben könnten, und so die Funktion für alle zu verbessern.

Eine perfekte Übersetzung auf Meta wäre super einfach, indem man einfach das teuerste LLM verwendet und ihm Zugriff auf Tools wie den Zugriff auf den Quellcode und Websuche gewährt.

1 „Gefällt mir“

Ich glaube nicht, dass irgendein Modell dieselben Übersetzungen für Meta wählen würde, die deutsche Übersetzer für die Discourse-Oberfläche gewählt haben. „Mitarbeiter" ist eine perfekte Übersetzung für „staff". Die Tatsache, dass sich einige Übersetzer vor Jahren entschieden haben, dass dies nicht zu kleinen Hobbyforen passt – wo „staff" bezahlte Angestellte impliziert – und daher „Team" gewählt haben, wird keine KI erraten, da es schlichtweg nicht die korrekte Übersetzung ist. Genau hier würde das Crowdin-Glossar helfen: Ohne es werden KI-generierte Begriffe niemals mit dem übereinstimmen, was Administratoren tatsächlich in der Oberfläche sehen – nicht weil KI nicht übersetzen kann, sondern weil sie nicht dieselben Lokalisierungsentscheidungen trifft wie menschliche Übersetzer. Es ist der Unterschied zwischen Übersetzung und Lokalisierung.
Ähnlich ist es bei anderen Begriffen wie „bootstrap mode" oder „impersonation".

Das würde es tun, da es genau dieselbe Auswahl in den config/locales/**/*.yml-Dateien zur Referenz hätte.

Absolut, und bei kleinen aufzählbaren Gruppen wie Kategorien und Tags würde es dem Agenten helfen, wenn er Zugriff auf die vorhandenen Übersetzungen hätte, die Teil des Quellcodes sind.

Das können wir bei Beiträgen nicht umsetzen, da die Kosten zu hoch wären, aber es ist eine Option für kleinere Seiten oder Kunden mit größeren Übersetzungsbudgets.

Dann solltest du vielleicht die KI-Übersetzung für Documentation und News and Events > Announcements deaktivieren :wink: Ich glaube nicht, dass es möglich ist, sicherzustellen, dass diese Übersetzungen hilfreich sind, besonders da vorgeschlagene Änderungen das Thema nicht nach oben bringen, sodass es keine einfache Möglichkeit gibt, zu bemerken, dass ein Thema aktualisiert wurde.

Im Allgemeinen ist der Grund für meine Empfehlung, die Glossar-Datei anstelle der Dateien mit allen Übersetzungen zu verwenden, der Kostenfaktor. Ich gehe davon aus, dass dort die relevantesten Entscheidungen einmalig enthalten sind, ohne jeden Text aufzunehmen.

So funktioniert es nicht; der Agent kann im Code nach passenden Textteilen suchen und lädt niemals das gesamte Dokument in den Kontext.

Das ist doch ein bisschen wie das Kind mit dem Bade ausschütten, oder?

Ich habe gerade Calendar subscription URLs for external calendar apps auf PT-BR geprüft, und es sieht nach einer großartigen Übersetzung aus, viel besser als gar nichts zu haben.

Es wird immer Verbesserungen an einem unbeaufsichtigten Workflow für maschinelle Übersetzungen geben, und @nat hat dank eurer Rückmeldung heute bereits dafür gesorgt, dass es besser wird!

Niemand erwartet Perfektion, und Meta ist ein Ort, an dem wir Funktionen frühzeitig einsetzen und zeigen können, was in Discourse für unsere Nutzer und Kunden möglich ist.

Hallo Team,

wie kann ich die von AI-Übersetzungen generierten spezifischen Tags in Discourse deaktivieren?

Ich finde die Qualität dieser KI-übersetzten Tags inkonsistent und möchte sie daher separat abschalten.

Vielen Dank.

Derzeit sind KI-Übersetzungen nicht nach Modelltypen gefiltert. Wenn sie aktiviert werden, gelten sie für Themen, Beiträge, Kategorien und Tags.

Mein Vorschlag wäre, die Tag-Übersetzungen direkt in den Tag-Einstellungen zu bearbeiten. Das erledigen Sie einmal und müssen es nie wieder tun.

Alternativ können Sie auch den Prompt aktualisieren, der vom Short Text Translator-Agenten verwendet wird.

1 „Gefällt mir“

Kannst du mir helfen, die Tag-Übersetzungen zu finden, die sich seit der Erstellung dieses Themas verbessert haben?

Die von OP erwähnten Tags (und einige weitere) sollten jetzt auf Meta verarbeitet werden können. Vielen Dank für die sehr umfassende Liste, das hat es mir leicht gemacht, und ich hätte es schon früher tun sollen :smiling_face:

Was das Übertragen weiterer Kontextinformationen in den Tag-Übersetzer betrifft, wird das noch etwas Zeit in Anspruch nehmen, da dies derzeit keine hohe Priorität hat.

2 „Gefällt mir“