Problemas con el valor de retorno del detector de configuración regional

Hemos encontrado dos problemas diferentes en dos foros distintos, donde la localización de contenido comenzó a traducir publicaciones a su idioma original.

Al investigar esto, resultó que el detector de configuración regional no estaba recibiendo un código de idioma puro del LLM.

En cambio, estaba envuelto en markdown ``` (copiando solo las partes relevantes del registro para facilitar la lectura

"delta":{"content":"```"}
"delta":{"content":"en```"},

o tenía comillas alrededor, probablemente confundido por la indicación que dice Salida: "en"

"delta":{"content":"\""}
"delta":{"content":"en\""}

Cambiar la última línea de la indicación a Tu respuesta debe ser un código de idioma, y nada más. No envuelvas tu respuesta en markdown. ayudó, pero supongo que LanguageDetector.detect debería limpiar un poco la respuesta (¿quizás permitiendo solo AZaz y - ?) antes de usarla.

4 Me gusta

gracias por informar @nat lo revisará

2 Me gusta

@RGJ tenemos una PR abierta para esto, pero ¿puedes compartir qué LLM estás usando?

1 me gusta

Hemos dado de baja esa instancia, pero hasta donde recuerdo era Ministral 3B.

Fusioné una corrección aquí que incluyó la actualización del prompt y el traslado de ejemplos del prompt del sistema a interacciones adecuadas.

Nuestro equipo está trabajando actualmente en evals para mejorar la confiabilidad en varios LLMs.

2 Me gusta

Este tema se cerró automáticamente después de 2 días. Ya no se permiten nuevas respuestas.