Problemas com o valor de retorno do detector de localidade

Encontramos dois problemas diferentes em dois fóruns distintos, onde a localização de conteúdo começou a traduzir postagens para o idioma original.

Ao investigar isso, descobrimos que o detector de local não estava recebendo um código de idioma puro do LLM.

Em vez disso, ele estava encapsulado em markdown (copiando apenas as partes relevantes do log para facilitar a leitura \n\n"delta":{"content":"\"}\n\"delta\":{\"content\":\"en"},\n\n ou tinha aspas ao redor, provavelmente confundido pelo prompt que diz `Output: \"en\"` \n\n"delta":{"content":"\""}\n"delta":{"content":"en\""}\n```
\n
Alterar a última linha do prompt para Sua resposta deve ser um código de idioma e nada mais. Não encapsule sua resposta em markdown. ajudou, mas acho que LanguageDetector.detect deveria limpar um pouco a resposta (talvez permitindo apenas AZaz e - ?) antes de usá-la.

4 curtidas

obrigado por relatar @nat dará uma olhada

2 curtidas

@RGJ temos um PR aberto para isso, mas você pode compartilhar qual LLM você está usando?

1 curtida

Desativamos essa instância, mas, pelo que me lembro, era a Ministral 3B.

Eu mesclei uma correção aqui que incluiu a atualização do prompt e a movimentação de exemplos do prompt do sistema para interações adequadas.

Nossa equipe está atualmente trabalhando em avaliações para melhorar a confiabilidade em vários LLMs.

2 curtidas

Este tópico foi fechado automaticamente após 2 dias. Novas respostas não são mais permitidas.