Мы столкнулись с двумя различными проблемами на двух разных форумах, где локализация контента начала переводить посты на их исходный язык (а в худшем случае — странным образом искажать содержимое или добавлять «этот пост уже на английском!»).
При深入ном анализе выяснилось, что детектор локали не получал от LLM чистый код языка.
Вместо этого он был обернут в markdown-разметку ``` (мы приводим только соответствующие части из логов для наглядности:
Изменение последней строки промпта на Ваш ответ должен быть только кодом языка, и ничем иным. Не оборачивайте ответ в markdown. помогло, но, полагаю, метод LanguageDetector.detect должен немного очищать полученный ответ (например, разрешая только символы AZaz и дефис -) перед его использованием.