Discourse AI no traduce un gran número de publicaciones y temas

panrafal · 13 Octubre, 2025 07:55

Hola,\n\nHe habilitado Discourse AI en nuestro foro comunitario y he comenzado a rellenar datos en varios idiomas. Alrededor del 60% de las publicaciones y temas están traducidos, pero en el proceso, estoy recibiendo MUCHOS errores en la consola (ai_translation_verbose_logs está habilitado) y ahora el rellenado de datos se ha detenido en gran medida:\n\n\nDiscourseAi::Translation: Failed to translate topic 563 to de: Validation failed: Title can't be blank, Fancy title can't be blank /var/www/discourse/vendor/bundle/ruby/3.3.0/gems/activerecord-8.0.3/\n\nDiscourseAi::Translation: Failed to translate post 582 to pl_PL: Validation failed: Raw can't be blank, Cooked can't be blank /var/www/discourse/vendor/bundle/ruby/3.3.0/gems/activerecord-8.0.3/lib/a\n\n\nLo extraño es:\n\n* Las publicaciones y temas mencionados parecen bastante normales, tienen diferentes tipos de títulos y cuerpos, tanto simples como complejos. Otros similares se tradujeron con éxito.\n* En un segundo o tercer intento, a menudo se traducen con éxito.\n* Estoy usando una persona personalizada para las publicaciones, pero esto sucede tanto en la persona incorporada de Traductor de Publicaciones como en la incorporada de traducciones de títulos de temas.\n* Sucede en todos los modelos que probé: Gemini-2.5-flash (sin pensar), Gemini-2.5-flash (pensando), GPT5 y GPT5-mini.\n* Sucede en todos los idiomas por igual (en, es, pt, de, pl_PL, fr, nl).\n\n¿Es posible registrar los prompts completos y las respuestas del modelo para depurar esto más a fondo?\n\nEstoy probando los mismos prompts manualmente en todos estos modelos y siempre responden con éxito.

panrafal · 13 Octubre, 2025 09:17

He encontrado ai_api_audit_logs y creo que he encontrado el problema.

Cuando se envía la traducción, hay una función get_max_tokens que asigna el número máximo de tokens basándose en la longitud del texto.

El problema es que se consume en su mayor parte por el razonamiento. Mira este registro de auditoría, el límite se estableció en 1000, y el razonamiento consumió los 1000 completos antes de que siquiera comenzara a generar la salida.

El límite para los modelos de razonamiento debería ser mucho mayor.

data: {"id":"chatcmpl-CQ7XU4Ep16RClb7OZQAxOXN9JWgIG","object":"chat.completion.chunk","created":1760341544,"model":"gpt-5-2025-08-07","service_tier":"default","system_fingerprint":null,"choices":[{"index":0,"delta":{"role":"assistant","content":"","refusal":null},"finish_reason":null}],"usage":null,"obfuscation":"dPNNK7ojEf"}

data: {"id":"chatcmpl-CQ7XU4Ep16RClb7OZQAxOXN9JWgIG","object":"chat.completion.chunk","created":1760341544,"model":"gpt-5-2025-08-07","service_tier":"default","system_fingerprint":null,"choices":[{"index":0,"delta":{},"finish_reason":"length"}],"usage":null,"obfuscation":"dM2r"}

data: {"id":"chatcmpl-CQ7XU4Ep16RClb7OZQAxOXN9JWgIG","object":"chat.completion.chunk","created":1760341544,"model":"gpt-5-2025-08-07","service_tier":"default","system_fingerprint":null,"choices":[],"usage":{"prompt_tokens":1075,"completion_tokens":1000,"total_tokens":2075,"prompt_tokens_details":{"cached_tokens":0,"audio_tokens":0},"completion_tokens_details":{"reasoning_tokens":1000,"audio_tokens":0,"accepted_prediction_tokens":0,"rejected_prediction_tokens":0}},"obfuscation":"j4"}

data: [DONE]

github.com/discourse/discourse

plugins/discourse-ai/lib/translation/base_translator.rb

26e5fc0d3


      
                post: @post,
              )
            max_tokens = get_max_tokens(text)
            llm_args = { max_tokens: }
          
            result = +""
            bot.reply(context, llm_args:) { |partial| result << partial }
            result
          end
          
          def get_max_tokens(text)
            if text.length < 100
              500
            elsif text.length < 500
              1000
            else
              text.length * 2
            end
          end
          
          def persona_setting

Falco · 13 Octubre, 2025 12:52

Simplemente no recomiendo usar ningún tipo de modelo de pensamiento para tareas de traducción.

https://www.reddit.com/r/LocalLLaMA/comments/1g7y74t/adding_a_thinking_turn_to_extend_llms_reasoning/

panrafal · 13 Octubre, 2025 15:10

Mi experiencia es todo lo contrario. Tengo un conjunto de instrucciones que quiero que se sigan y que requieren la comprensión del contexto, las cuales son ignoradas por los modelos que no piensan o se aplican en situaciones erróneas. Acabo de traducir una aplicación completa de esta manera: más de 3000 cadenas, con modelos de razonamiento que dan resultados mucho mejores.

Reduje el esfuerzo de pensamiento a bajo según mis hallazgos y obtuve todas las traducciones. Pero creo que limitar los tokens de salida de esa manera es contraproducente, ya que los modelos de pensamiento no tienen restricciones para ser utilizados en traducciones, y el usuario no tiene ni idea de por qué está fallando.

La solución podría ser tan simple como multiplicar por 2 si el LLM tiene el pensamiento habilitado. O exponer un multiplicador como una opción de configuración.

Falco · 13 Octubre, 2025 16:16

Tuvimos que limitar max_tokens ya que nuestro uso de salidas estructuradas significaba que muchos modelos pequeños podían caer fácilmente en bucles infinitos durante las traducciones.

Creo que la versión más reciente de la API de Respuestas de OpenAI aplica max_tokens sin contar los tokens de pensamiento, lo que resuelve este problema.

panrafal · 13 Octubre, 2025 17:27

Estoy probando el último GPT-5. Vi exactamente el mismo problema con Gemini 2.5 Pro y 2.5 Flash. ¿Por qué no aumentar un poco el límite?

He gastado bastante en intentos fallidos, de los cuales ni siquiera me habría enterado si no hubiera habilitado el registro de depuración, y luego tuve que investigar en el Explorador de Datos para encontrar los registros. Todo esto mientras usaba un creador de modelos predefinido.

DevTeVe · 27 Octubre, 2025 11:42

Desactivé la transmisión y eso lo hizo mucho mejor (y todavía está pensando)

nat · 6 Noviembre, 2025 16:33

Hemos fusionado una actualización que te da acceso a una nueva configuración ai_translation_max_tokens_multiplier que por defecto es 1.

Deberías poder aumentarla a cualquier número que desees para tratar el límite que estás viendo.

github.com/discourse/discourse

FEATURE: Add a multiplier for max tokens, typically used for various llm settings like reasoning

main ← base-token-multipler

opened 03:47AM - 06 Nov 25 UTC

nattsw

+28 -11

Meta: https://meta.discourse.org/t/discourse-ai-failing-to-translate-large-numbe…r-of-posts-and-topics/385414 This PR adds a new setting which allows users to modify the max tokens limit via a multiplier. There are good defaults in place already, but in reasoning models they seem to require more than the defaults. As there can be many other reasons this max needs to be bumped up, we're providing a generic multiplier as a setting.

nat · 10 Noviembre, 2025 00:00

Este tema se cerró automáticamente después de 3 días. Ya no se permiten nuevas respuestas.

Tema		Respuestas	Vistas
AI translation backfill not working after all settings configured Support ai , content-localization	35	384	17 Noviembre 2025
The usage problem after using AI translation Support ai , dynaloc	7	107	15 Julio 2025
Why Is the Discourse AI Translation Icon Not Appearing? Support ai , content-localization	7	80	5 Octubre 2025
Allow LLM providers to serve as translators for the discourse-translate plugin Feature translator , completed , ai	6	161	15 Agosto 2025
Error when translate post by ai （Job exception: undefined method `strip' for an instance of DiscourseAi::Completions::StructuredOutput Support ai , dynaloc	4	74	26 Noviembre 2025

Discourse AI no traduce un gran número de publicaciones y temas

Temas relacionados