Comentários HTML também são resumidos pela IA

Os comentários HTML também serão incluídos no resumo.
Como os usuários que visualizarem o resumo provavelmente não poderão ver os comentários, acho que seria melhor excluí-los do resumo.

3 curtidas

Com licença. Percebi o comentário porque o desempenho do modelo é bom.

A publicação inclui um exemplo de comentário HTML (<!-- Discourse é ótimo! > ) para ilustrar o problema. はこん

Marcando como #wontfix, pois não estou convencido de que valha a pena o custo adicional de pré-processamento de conteúdo.

Se isso te incomodar na sua instância, você pode alterar a propriedade summary_agent para instruí-lo a ignorar isso.

5 curtidas

Isso não está introduzindo um canal oculto pelo qual uma publicação maliciosa poderia influenciar o resumo sem nenhum sinal visível de que está fazendo isso?

3 curtidas

É por isso que os LLMs dividem os prompts em sistema e usuário, para haver uma diferenciação entre entradas seguras e inseguras.

Mas sim, essa é uma possibilidade, especialmente entre modelos menores e mais antigos.

2 curtidas

Mas, como eu entendo, nada disso é mecanismo, é (no máximo) influência. Daí os infindáveis jailbreaks. Então, realmente importa qual texto é mostrado ao LLM, se você se importa com o que sai.