RGJ
(Richard - Communiteq)
7 בספטמבר, 2025, 8:49am
1
נתקלנו בשתי בעיות שונות בשני פורומים שונים, בהן הלוקליזציה של התוכן החלה לתרגם פוסטים לשפת המקור שלהם.
בבדיקה מעמיקה, התברר שמזהה הלוקל לא קיבל קוד שפה טהור מה-LLM.
במקום זאת, הוא היה עטוף ב-markdown ``` (העתקת החלקים הרלוונטיים מהלוג רק לצורך קריאות
"delta":{"content":"```"}
"delta":{"content":"en```"},
או שהיו לו מרכאות מקיפות, כנראה מבולבל מההנחיה שאומרת Output: \"en\"
"delta":{"content":"\""}
"delta":{"content":"en\""}
שינוי השורה האחרונה של ההנחיה ל-Your response must be a language code, and nothing else. Do not wrap your response in markdown. עזר, אבל אני מניח ש-LanguageDetector.detect צריך לנקות את התשובה קצת (אולי לאפשר רק AZaz ו-?) לפני השימוש בה.
4 לייקים
sam
(Sam Saffron)
15 בספטמבר, 2025, 1:24am
3
תודה על הדיווח @nat יבחן זאת
2 לייקים
nat
(Natalie T)
4 בנובמבר, 2025, 3:21am
5
@RGJ we have a PR open for this, but can you share what LLM you’re using?
לייק 1
RGJ
(Richard - Communiteq)
4 בנובמבר, 2025, 6:14am
7
We’ve decommissioned that instance, but as far as I remember it was Ministral 3B.
nat
(Natalie T)
5 בנובמבר, 2025, 10:17am
8
I merged a fix here that included updating the prompt and moving examples away from the system prompt and into proper interaction.
main ← sanitise-locale-detection
opened 11:37AM - 03 Nov 25 UTC
This commit improves the prompt, and also matches the return value against this:…
- https://datatracker.ietf.org/doc/html/rfc5646#section-2.2.1
- **Primary Language Subtag**: ... Two-character primary language subtags were defined in the IANA registry according to the assignments found in the standard "ISO 639-1:2002 ...
- **Extended Language Subtags**: ... Extended language subtags consist solely of three-letter subtags.
Meta: https://meta.discourse.org/t/locale-detector-return-value-issues/381852
Our team is also currently working on evals to improve reliability across various LLMs.
2 לייקים
nat
(Natalie T)
נסגר ב־
8 בנובמבר, 2025, 12:00am
9
This topic was automatically closed after 2 days. New replies are no longer allowed.