HTML-комментарии также будут включены в сводку.
Поскольку пользователи, просматривающие сводку, скорее всего, не смогут видеть комментарии, я думаю, лучше всего исключить комментарии из сводки.
Извините. Я заметил комментарий, потому что производительность модели хорошая.
В посте приведен пример HTML-комментария (
<!-- Discourse is great! -->) для иллюстрации проблемы. はこん
Отмечено как #wontfix, поскольку я не уверен, что это оправдывает дополнительные затраты на предварительную обработку контента.
Если это мешает вам в вашем экземпляре, вы можете изменить свойство summary agent, чтобы указать ему игнорировать эти элементы.
Не вводит ли это поведение скрытый канал, по которому вредоносный пост может влиять на сводку без каких-либо видимых признаков этого влияния?
Именно поэтому LLM разделяют промпты на системные и пользовательские, чтобы провести различие между безопасными и небезопасными вводимыми данными.
Но да, такая возможность существует, особенно среди более старых и небольших моделей.
Но насколько я понимаю, ни одно из этого не является механизмом, это (в лучшем случае) влияние. Отсюда и бесконечные джейлбрейки. Так что, если вам важно, что вы получите на выходе, то действительно имеет значение, какой текст показывается LLM.