Problemi con il valore restituito dal rilevatore di locale

Abbiamo riscontrato due problemi diversi su due forum diversi, in cui la localizzazione dei contenuti ha iniziato a tradurre i post nella loro lingua originale.

Analizzando la situazione, è emerso che il rilevatore di locale non riceveva un codice lingua puro dall’LLM.

Invece, era racchiuso in markdown ``` (copiando solo le parti pertinenti dal log per leggibilità

"delta":{"content":"```"}
"delta":{"content":"en```"},

o aveva virgolette circostanti, probabilmente confuse dal prompt che dice Output: "en"

"delta":{"content":"\""}
"delta":{"content":"en\""}

Modificare l’ultima riga del prompt in La tua risposta deve essere un codice lingua, e nient'altro. Non racchiudere la tua risposta in markdown. ha aiutato, ma immagino che LanguageDetector.detect dovrebbe ripulire un po’ la risposta (magari consentendo solo AZaz e - ?) prima di utilizzarla.

4 Mi Piace

grazie per la segnalazione @nat darà un’occhiata

2 Mi Piace

@RGJ abbiamo un PR aperto per questo, ma puoi condividere quale LLM stai usando?

1 Mi Piace

Abbiamo dismesso quell’istanza, ma per quanto mi ricordo era Ministral 3B.

Ho unito una correzione qui che includeva l’aggiornamento del prompt e lo spostamento degli esempi dal prompt di sistema a un’interazione corretta.

Il nostro team sta attualmente lavorando su valutazioni per migliorare l’affidabilità su vari LLM.

2 Mi Piace

Questo argomento è stato chiuso automaticamente dopo 2 giorni. Non sono più consentite nuove risposte.