Discourse KI Fehler?

Ich stoße auf einige Fehler bei der Verwendung von Discourse AI. Hier ist die Situation:
Betrachten wir zunächst einen korrekten Beitrag, um zu zeigen, dass meine Konfiguration nicht das Problem ist und alles so funktioniert, wie ich es beabsichtigt habe.
Die Basissprache meiner Website ist vereinfachtes Chinesisch, und es sind 9 weitere Sprachen verfügbar.
Dieser Beitrag „New post test 0 translation“ ist normal.

Einige einzelne Beiträge weisen jedoch Probleme auf. Zum Beispiel:
Dieser Beitrag „About ‘Image Library’ category“. Der ursprüngliche Beitrag wurde auf vereinfachtem Chinesisch veröffentlicht (er wurde automatisch veröffentlicht, als die Kategorie erstellt wurde).
Aber in den Übersetzungsergebnissen wurde das ursprüngliche vereinfachte Chinesisch erneut in „zh_CN“ übersetzt, anstatt ins Englische übersetzt zu werden.

Als ich versuchte, die englische Übersetzung manuell mit dem roten Globus-Symbol hinzuzufügen, geschah etwas Seltsames.


In der Dropdown-Liste kann ich keine separate Übersetzung für Englisch hinzufügen.
In meinen globalen Einstellungen ist Englisch (US) jedoch bereits korrekt hinzugefügt.

Ich habe den CDN-Cache deaktiviert und den lokalen Browser-Cache wiederholt gelöscht.
Dies schließt Caching als Problem aus.
Meine grundlegende Konfiguration kann ebenfalls ausgeschlossen werden, da das erste Bild das korrekte Verhalten zeigt.
Ich verstehe nicht, warum dieses Problem auftritt. Wie kann ich es beheben?
Meine Discourse-Version ist 3.6.0.beta1-dev(b8e86ceb23)
Das Server-Betriebssystem ist Debian 12.12
Ich habe dies lokal mit den neuesten Versionen der Browser Chrome und Opera getestet.
URL für den korrekten Fall: https://openttc.com/t/topic/61
URL für den falschen Fall: https://openttc.com/t/topic/58

Das ist kein BUG. Da die Standard-Sprache für alle Kategoriebeschreibungen (systemerstellt) En ist. Egal was Sie eingeben, der Standard ist En-Post. Daher wird die Übersetzung nicht ausgelöst.

Jeder Beitrag hat eine von KI erkannte Sprache.

Wenn Sie einen Beitrag haben, der ursprünglich auf „Chinesisch“ verfasst wurde, sollte die LLM ihn korrekt als „zh_CN“ erkennen. Sie können die erkannte Sprache im normalen Verfasser (nicht im Übersetzungsverfasser) neben der :globe_with_meridians: sehen.

Die erkannte Sprache ist wichtig, damit der Übersetzer sie nicht unnötigerweise in die erkannte Sprache selbst übersetzt, sondern den Beitrag in jede andere Sprache übersetzt.

Ich vermute, was bei https://openttc.com/t/topic/58 passiert, ist, dass die erkannte Sprache falsch ist. Können Sie das überprüfen?

1 „Gefällt mir“

Ja. Es wurde fälschlicherweise als en erkannt und nicht als zh_CN. Ich habe überprüft und festgestellt, dass alle vom System erstellten Kategoriebeschreibungsbeiträge als en erkannt wurden, auch wenn sie auf Chinesisch geschrieben wurden.

Neues Problem: Unterstützt die FAQ-Seite mehrere Sprachen? Wo sollen die Übersetzungen hinzugefügt werden?

1 „Gefällt mir“

Ich glaube, die FAQ-Seite verwendet die typischen I18n-Schlüssel. Sie können zur Admin-Seite Ihres Standorts für Website-Texte gehen @ z. B. https://openttc.com/admin/customize/site_texts?q=guidelines_topic.body um sie zu ersetzen.

1 „Gefällt mir“

Okay, vielen Dank für Ihre Hilfe.

Ich denke, das ist ein echtes Problem. Ich weiß nicht, ob dies ein weit verbreitetes Problem ist oder ob es an meiner Fehlkonfiguration liegt.

Es könnte auch zeitbezogen sein. Wenn die Kategorien erstellt wurden, bevor die Website-Sprache umgeschaltet wurde, könnten die Sprachen der Kategoriethemen alle Englisch sein.

In diesem Fall können Sie zum ersten Beitrag der Themen gehen, den Composer öffnen und sie auf Chinesisch umschalten.

Hallo. Nach meinen Versuchen.
Ich habe vor 6 Minuten eine neue Kategorie erstellt: https://openttc.com/t/topic/66
Dann habe ich nichts getan. Ich wartete darauf, dass die Übersetzung wirksam wurde.
Danach erhielt ich einen Beitrag, dessen Inhalt Chinesisch war, aber als en erkannt wurde.



Als diese Kategorie erstellt wurde, war die Sprache meiner Website zu 100 % vereinfachtes Chinesisch.
Mein KI-Modell verwendet Llama3.1 8b von Openrouter.

Interessant, können Sie diese Daten-Explorer-Abfrage ausführen?

-- [params]
-- integer :topic_id = 66

SELECT 
  a.id,
  a.created_at,
  a.response_tokens,
  (REGEXP_MATCH(a.raw_response_payload, '\"text\": \"([^\"\\\\]+)\"'))[1] AS llm_detected_locale,
  a.raw_response_payload
FROM ai_api_audit_logs a
JOIN posts p ON p.id = a.post_id AND p.deleted_at IS NULL
LEFT JOIN topics t ON t.id = a.topic_id AND t.deleted_at IS NULL
WHERE t.id = :topic_id
AND p.post_number = 1
AND a.feature_name = 'translation'
AND a.response_tokens < 5

Dies sollte uns zeigen, was die LLM tatsächlich zurückgibt.

Wenn wir ein „en“ in der Spalte llm_detected_locale sehen, vermute ich, dass die Prompts Ihrer Website zur Erkennung von Gebietsschemata geändert werden müssen, oder Sie können eine besser geeignete LLM verwenden (vielleicht qwen?).

Hallo. Ich habe das Problem letztendlich nicht gelöst, aber es hatte keine großen Auswirkungen.
Die genaueste Beschreibung des Problems wäre: Wenn ich eine neue Kategorie erstelle, wird die Sprache des automatisch generierten Beitrags „Über diese Kategorie“ als en erkannt. Obwohl der Textinhalt tatsächlich vereinfachtes Chinesisch ist, wird er beim Öffnen des Beitrags als Englisch erkannt und muss manuell geändert werden.
Ich bin mir nicht sicher, ob dies mit meiner app.yml-Einstellung zusammenhängt?