Os comentários HTML também serão incluídos no resumo.
Como os usuários que visualizarem o resumo provavelmente não poderão ver os comentários, acho que seria melhor excluí-los do resumo.
Com licença. Percebi o comentário porque o desempenho do modelo é bom.
A publicação inclui um exemplo de comentário HTML (<!-- Discourse é ótimo! > ) para ilustrar o problema. はこん
Marcando como #wontfix, pois não estou convencido de que valha a pena o custo adicional de pré-processamento de conteúdo.
Se isso te incomodar na sua instância, você pode alterar a propriedade summary_agent para instruí-lo a ignorar isso.
Isso não está introduzindo um canal oculto pelo qual uma publicação maliciosa poderia influenciar o resumo sem nenhum sinal visível de que está fazendo isso?
É por isso que os LLMs dividem os prompts em sistema e usuário, para haver uma diferenciação entre entradas seguras e inseguras.
Mas sim, essa é uma possibilidade, especialmente entre modelos menores e mais antigos.
Mas, como eu entendo, nada disso é mecanismo, é (no máximo) influência. Daí os infindáveis jailbreaks. Então, realmente importa qual texto é mostrado ao LLM, se você se importa com o que sai.