HTMLコメントもサマリーに含まれます。
サマリーを表示するユーザーは、コメントを見ることができない可能性が高いので、コメントをサマリーから除外するのが最善だと考えます。
「いいね!」 3
失礼します。モデルのパフォーマンスが良かったため、そのコメントに気づきました。
投稿には、問題を説明するために例のHTMLコメント()が含まれています。 はこん
#wontfix としてマークしました。これは、追加の前処理コンテンツのトレードオフに見合う価値があるとは確信していないためです。
あなたのインスタンスで気になる場合は、要約エージェントのプロンプトを変更して、それらを無視するように指示することができます。
「いいね!」 5
この動作は、悪意のある投稿が何らかの目に見える兆候なしに要約に影響を与えることができる隠しチャネルを導入しているのでしょうか?
「いいね!」 3
そのため、LLM はプロンプトをシステムとユーザーに分割し、安全な入力と安全でない入力を区別できるようにしています。
しかし、確かにその可能性はあります。特に、小さく、古いモデルにおいてです。
「いいね!」 2
しかし、私の理解では、これらはメカニズムではなく、(最善の場合でも)影響に過ぎません。そのため、ジェイルブレイクが絶えません。したがって、出力結果を気にするのであれば、LLMに提示されるテキストの内容は重要になります。