Problemas com o valor de retorno do detector de localidade

RGJ · Setembro 7, 2025, 8:49am

Encontramos dois problemas diferentes em dois fóruns distintos, onde a localização de conteúdo começou a traduzir postagens para o idioma original.

Ao investigar isso, descobrimos que o detector de local não estava recebendo um código de idioma puro do LLM.

Em vez disso, ele estava encapsulado em markdown (copiando apenas as partes relevantes do log para facilitar a leitura \n\n"delta":{"content":"\"}\n\"delta\":{\"content\":\"en"},\n\n ou tinha aspas ao redor, provavelmente confundido pelo prompt que diz `Output: \"en\"` \n\n"delta":{"content":"\""}\n"delta":{"content":"en\""}\n```
\n
Alterar a última linha do prompt para Sua resposta deve ser um código de idioma e nada mais. Não encapsule sua resposta em markdown. ajudou, mas acho que LanguageDetector.detect deveria limpar um pouco a resposta (talvez permitindo apenas AZaz e - ?) antes de usá-la.

sam · Setembro 15, 2025, 1:24am

obrigado por relatar @nat dará uma olhada

nat · Novembro 4, 2025, 3:21am

@RGJ temos um PR aberto para isso, mas você pode compartilhar qual LLM você está usando?

RGJ · Novembro 4, 2025, 6:14am

Desativamos essa instância, mas, pelo que me lembro, era a Ministral 3B.

nat · Novembro 5, 2025, 10:17am

Eu mesclei uma correção aqui que incluiu a atualização do prompt e a movimentação de exemplos do prompt do sistema para interações adequadas.

github.com/discourse/discourse

FIX: Improve prompt and check returned value conforms to standard

main ← sanitise-locale-detection

opened 11:37AM - 03 Nov 25 UTC

nattsw

+92 -34

This commit improves the prompt, and also matches the return value against this:… - https://datatracker.ietf.org/doc/html/rfc5646#section-2.2.1 - **Primary Language Subtag**: ... Two-character primary language subtags were defined in the IANA registry according to the assignments found in the standard "ISO 639-1:2002 ... - **Extended Language Subtags**: ... Extended language subtags consist solely of three-letter subtags. Meta: https://meta.discourse.org/t/locale-detector-return-value-issues/381852

Nossa equipe está atualmente trabalhando em avaliações para melhorar a confiabilidade em vários LLMs.

nat · Novembro 8, 2025, 12:00am

Este tópico foi fechado automaticamente após 2 dias. Novas respostas não são mais permitidas.

Tópico		Respostas	Visualizações
Default LLM model is required prior to enabling "Chat"? Bug content-localization , ai	2	118	15 de Setembro de 2025
Localized content shows raw HTML or json Bug content-localization	2	83	15 de Setembro de 2025
Content Localization and Automatic Translations for Your Community Announcements dynaloc , ai , content-localization	29	1979	1 de Setembro de 2025
Language detect issue [missing %{language} value] Support translator	7	2488	10 de Agosto de 2019
Error when translate post by ai （Job exception: undefined method `strip' for an instance of DiscourseAi::Completions::StructuredOutput Support ai , dynaloc	6	131	8 de Dezembro de 2025

Problemas com o valor de retorno do detector de localidade

Tópicos relacionados