Stavo utilizzando un LLM ospitato su Groq; era circa al 95% di completamento quando ho iniziato a ricevere errori. Dopo aver indagato, ho scoperto che Groq aveva deprecato il modello che stavo usando. Quindi ho configurato un nuovo modello su Groq e aggiornato i parametri del modello in Discourse.
Osservo che Discourse sta ora utilizzando milioni di token con il nuovo LLM per la traduzione ogni singolo giorno, ma la barra di avanzamento nella pagina di stato delle traduzioni non progredisce affatto (è ancora bloccata al 95%).
Quindi sto cercando di capire cosa succede quando cambiano i parametri del LLM: ricomincia le traduzioni da zero? Se è cosĂŹ, câè qualche modo per impedirlo e riprendere semplicemente da dove si era interrotto?
Dipende, ad esempio, se traduci usando un modello Gemini e poi passi a un altro, creerai una nuova cache di parole. Nella mia esperienza, preferisco mantenere tre rotte: due con lo stesso modello e ora ho attivato un Gemini Flash Lite per i nuovi contenuti, e finora nessun problema.
Cosa posso fare per verificare cosa sta succedendo?
Ogni giorno lâLLM consuma milioni di token per le traduzioni (sta raggiungendo il limite giornaliero dellâAPI), ma non câè alcun progresso nelle statistiche di traduzione (0 traduzioni incrementali). Vedere gli screenshot.
Ok, quindi ho attivato il debug della traduzione AI dalla console di Rails con SiteSettings.ai_translation_verbose_logs = true e negli ultimi 2 giorni sto vedendo questo nella pagina dei log degli errori in /logs.
DiscourseAi::Translation: Errore durante la traduzione del topic 5898 in zh_TW: {âerrorâ:{âmessageâ:"Limite di velocitĂ raggiunto per il modello openai/gpt-oss-120b nellâorganizzazione org_01kccx1baz5sXXX nel livello di servizio on_demand per i token al giorno (TPD): Limite 200000, Utilizzati 193366, Richiesti 7514. Riprova tra 6m20.16s.
Lo stesso topic continua a consumare tutto il limite giornaliero di token. Non riesco a capire perchĂŠ un singolo topic rimanga bloccato in un loop?
Quando dici âpensieroâ, intendi la âvisioneâ? Non vedo alcuna casella di controllo o opzione per il pensiero nella pagina di configurazione dellâLLM su Discourse.
Sono curioso di sapere quale impatto avrebbe questo sulle traduzioni?
Ă bloccato su questa pagina da una settimana, consumando tutti i token giornalieri:
DiscourseAi::Translation: Traduzione fallita per il topic 5898 in fr: {âerrorâ:{âmessageâ:âLimite di velocitĂ raggiunto per il modello openai/gpt-oss-120b nellâorganizzazione org_01kccx1be8fffaz5sbe17 nel piano tariffario on_demand per token al giorno (TPD): Limite 200000, Utilizzati 197080, Richiesti 7512. Riprova tra 33m3.744s.â
@Falco se imposto lo sforzo di ragionamento su nessuno, ottengo questo errore:
DiscourseAi::Translation: Impossibile tradurre lâargomento 5898 in fr: {âerrorâ:{âmessageâ:âreasoning_effort deve essere uno tra low, medium o highâ,âtypeâ:âinvalid_request_errorâ}}
Da quanto ricordo nel debug di un problema simile per un cliente, non è semplicemente possibile utilizzare un modello di ragionamento per il rilevamento della localizzazione.
Non utilizziamo output strutturati in quel contesto, il che significa che siamo estremamente sensibili al formato dellâoutput. I blocchi di ragionamento li interrompono il 100% delle volte e, senza il rilevamento della localizzazione, la traduzione rimane sempre bloccata.