ロケール検出器の戻り値の問題

2つの異なるフォーラムで、コンテンツのローカライゼーションが投稿を元の言語に翻訳し始めるという2つの異なる問題が発生しました。\n\nこれを調査したところ、ロケール検出器がLLMから純粋な言語コードを受け取っていないことが判明しました。\n\n代わりに、それはマークダウン でラップされていました(読みやすくするためにログから関連部分をコピーしました。\n\n\n"delta":{"content":"\"}\n\"delta\":{\"content\":\"en"},\n\n\nまたは、おそらくプロンプトが `Output: \"en\"` と言っていることに混乱したため、周囲に引用符が付いていました。\n\n\n"delta":{"content":"\""}\n"delta":{"content":"en\""}\n```\n\nプロンプトの最後の行を Your response must be a language code, and nothing else. Do not wrap your response in markdown. に変更したところ役立ちましたが、おそらく LanguageDetector.detect は使用する前に回答を少しクリーンアップすべきだと思います(AZaz と - のみ許可するなど)。

「いいね!」 4

報告ありがとうございます。@nat が確認します。

「いいね!」 2

@RGJ この件についてはPR(プルリクエスト)をオープンしていますが、使用しているLLM(大規模言語モデル)を教えていただけますか?

「いいね!」 1

そのインスタンスは廃止しましたが、私の記憶が正しければ、それはミニストラル 3B でした。

ここに、プロンプトの更新と、例をシステムプロンプトから適切なインタラクションへの移動を含んだ修正をマージしました。

私たちのチームは現在、さまざまなLLMにわたる信頼性の向上を目指して評価に取り組んでいます。

「いいね!」 2

このトピックは2日後に自動的に閉じられました。返信はもう受け付けられません。