¿Error en Discourse AI?

Estoy encontrando algunos errores al usar Discourse AI. Aquí está la situación:
Primero, veamos una publicación correcta para demostrar que mi configuración no es el problema y que todo funciona como esperaba.
El idioma base de mi sitio es chino simplificado y hay otros 9 idiomas disponibles.
Esta publicación “New post test 0 translation” es normal.

Sin embargo, algunas publicaciones individuales están experimentando problemas. Por ejemplo:
Esta publicación “About ‘Image Library’ category”. La publicación original se publicó en chino simplificado (se publicó automáticamente cuando se creó la categoría).
Pero en los resultados de la traducción, el chino simplificado original se ha traducido nuevamente a “zh_CN”, en lugar de traducirse al inglés.

Cuando intenté agregar manualmente la traducción al inglés usando el ícono del globo rojo, algo extraño sucedió


En la lista desplegable, no puedo agregar una traducción separada para el inglés.
Sin embargo, en mi configuración global, el inglés (EE. UU.) ya se ha agregado correctamente.

He deshabilitado la caché del CDN y he borrado repetidamente la caché del navegador local.
Esto descarta la caché como el problema.
Mi configuración básica también se puede descartar, ya que la primera imagen muestra el comportamiento correcto.
No entiendo por qué está ocurriendo este problema. ¿Cómo puedo solucionarlo?
Mi versión de Discourse es 3.6.0.beta1-dev(b8e86ceb23)
El sistema operativo del servidor es Debian 12.12
He probado esto localmente usando las últimas versiones de los navegadores Chrome y Opera.
URL para el caso correcto: https://openttc.com/t/topic/61
URL para el caso incorrecto: https://openttc.com/t/topic/58

Esto no es un BUG. Porque el idioma predeterminado de las descripciones de todas las categorías (creadas por el sistema) es En. No importa lo que ingreses, el valor predeterminado será la publicación En. Por lo tanto, la traducción no se activará.

Cada publicación tiene un idioma detectado por IA.

Si tienes una publicación escrita originalmente en “Chino”, por derecho, el LLM debería detectarla como “zh_CN”. Puedes ver el idioma detectado en el compositor normal (no en el compositor de traducción) junto a :globe_with_meridians:.

El idioma detectado es importante para que el traductor no lo traduzca innecesariamente al idioma detectado y traduzca la publicación a todos los demás idiomas.

Sospecho que lo que está sucediendo con https://openttc.com/t/topic/58 es que el idioma detectado es incorrecto, ¿puedes comprobarlo?

1 me gusta

Sí. Se detectó erróneamente como en, en lugar de zh_CN. Lo revisé y descubrí que todas las publicaciones de descripción de categorías creadas por el sistema se detectaron como en. Incluso las escritas en chino.

Nueva pregunta: ¿La página de preguntas frecuentes admite varios idiomas? ¿Dónde se deben agregar las traducciones?

1 me gusta

Creo que la página de preguntas frecuentes utiliza las claves I18n típicas. Puede ir a la página de administración de su sitio para ver los textos del sitio @ por ejemplo, https://openttc.com/admin/customize/site_texts?q=guidelines_topic.body para reemplazarlo.

1 me gusta

De acuerdo, muchas gracias por tu ayuda.

Creo que este es un problema real. No sé si esta situación es común o se debe a una configuración incorrecta.

También podría estar relacionado con el tiempo. Si las categorías se crearon antes de cambiar el idioma del sitio, los idiomas de los temas de las categorías podrían ser todos en inglés.

En ese caso, puedes ir a la primera publicación de los temas, abrir el compositor y cambiarlos a chino.

Hola. Después de mi intento.
Creé una nueva categoría hace 6 minutos: https://openttc.com/t/topic/66
Luego no hice nada. Esperando que la traducción surta efecto.
Después de eso, obtuve una publicación cuyo contenido era chino, pero fue reconocido como en.



Cuando se creó esta categoría, el idioma de mi sitio era 100% chino simplificado.
Mi modelo de IA utiliza Llama3.1 8b de Openrouter.

Interesante, ¿puedes ejecutar esta consulta del explorador de datos?

-- [params]
-- integer :topic_id = 66

SELECT 
  a.id,
  a.created_at,
  a.response_tokens,
  (REGEXP_MATCH(a.raw_response_payload, '"text": "([^"\\]+)"'))[1] AS llm_detected_locale,
  a.raw_response_payload
FROM ai_api_audit_logs a
JOIN posts p ON p.id = a.post_id AND p.deleted_at IS NULL
LEFT JOIN topics t ON t.id = a.topic_id AND t.deleted_at IS NULL
WHERE t.id = :topic_id
AND p.post_number = 1
AND a.feature_name = 'translation'
AND a.response_tokens < 5

Esto debería decirnos qué está devolviendo realmente el LLM.

Hola. Finalmente no resolví este problema, pero no tuvo un gran impacto.
La descripción más precisa del problema sería: Cuando creo una nueva categoría, la publicación “Acerca de esta categoría” generada automáticamente por el sistema, su idioma predeterminado se reconoce como “en”. Aunque el contenido del texto está en chino simplificado, cuando abro la publicación, se reconoce como inglés y necesito cambiarlo manualmente.
No estoy seguro si esto está relacionado con la configuración de mi archivo app.yml.