Problemas con el valor de retorno del detector de configuración regional

RGJ · 7 Septiembre, 2025 08:49

Hemos encontrado dos problemas diferentes en dos foros distintos, donde la localización de contenido comenzó a traducir publicaciones a su idioma original.

Al investigar esto, resultó que el detector de configuración regional no estaba recibiendo un código de idioma puro del LLM.

En cambio, estaba envuelto en markdown ``` (copiando solo las partes relevantes del registro para facilitar la lectura

"delta":{"content":"```"}
"delta":{"content":"en```"},

o tenía comillas alrededor, probablemente confundido por la indicación que dice Salida: "en"

"delta":{"content":"\""}
"delta":{"content":"en\""}

Cambiar la última línea de la indicación a Tu respuesta debe ser un código de idioma, y nada más. No envuelvas tu respuesta en markdown. ayudó, pero supongo que LanguageDetector.detect debería limpiar un poco la respuesta (¿quizás permitiendo solo AZaz y - ?) antes de usarla.

sam · 15 Septiembre, 2025 01:24

gracias por informar @nat lo revisará

nat · 4 Noviembre, 2025 03:21

@RGJ tenemos una PR abierta para esto, pero ¿puedes compartir qué LLM estás usando?

RGJ · 4 Noviembre, 2025 06:14

Hemos dado de baja esa instancia, pero hasta donde recuerdo era Ministral 3B.

nat · 5 Noviembre, 2025 10:17

Fusioné una corrección aquí que incluyó la actualización del prompt y el traslado de ejemplos del prompt del sistema a interacciones adecuadas.

github.com/discourse/discourse

FIX: Improve prompt and check returned value conforms to standard

main ← sanitise-locale-detection

opened 11:37AM - 03 Nov 25 UTC

nattsw

+92 -34

This commit improves the prompt, and also matches the return value against this:… - https://datatracker.ietf.org/doc/html/rfc5646#section-2.2.1 - **Primary Language Subtag**: ... Two-character primary language subtags were defined in the IANA registry according to the assignments found in the standard "ISO 639-1:2002 ... - **Extended Language Subtags**: ... Extended language subtags consist solely of three-letter subtags. Meta: https://meta.discourse.org/t/locale-detector-return-value-issues/381852

Nuestro equipo está trabajando actualmente en evals para mejorar la confiabilidad en varios LLMs.

nat · 8 Noviembre, 2025 00:00

Este tema se cerró automáticamente después de 2 días. Ya no se permiten nuevas respuestas.

Tema		Respuestas	Vistas
Default LLM model is required prior to enabling "Chat"? Bug content-localization , ai	2	118	15 Septiembre 2025
Localized content shows raw HTML or json Bug content-localization	2	83	15 Septiembre 2025
Content Localization and Automatic Translations for Your Community Announcements dynaloc , ai , content-localization	29	1979	1 Septiembre 2025
Language detect issue [missing %{language} value] Support translator	7	2488	10 Agosto 2019
Error when translate post by ai （Job exception: undefined method `strip' for an instance of DiscourseAi::Completions::StructuredOutput Support ai , dynaloc	6	131	8 Diciembre 2025

Problemas con el valor de retorno del detector de configuración regional

Temas relacionados