Примеры триажа ИИ не отправляются корректно?

У меня есть агент для проверки постов на наличие банковских реквизитов для переводов (это опасно). В разделе «Примеры» я привожу ему пример.

Системный промпт

Проверьте этот пост на наличие банковских реквизитов, включая номер счета и код банка. Если пост, по-видимому, содержит такую информацию, ответьте одним словом «flag». В противном случае ответьте одним словом «ignore».

Сообщение пользователя в примере 1

Привет всем, просто хотел поделиться деталями банковского перевода для организованной нами групповой покупки. Получающий банк: First National Trust Bank, Чикаго, Иллинойс | ABA/код банка: 0710003 | Номер счета: 4827093 | Имя владельца счета: Marcus T. Holdings LLC | Назначение платежа: GroupBuy-2024-Q4.

Ответ модели в примере 1

flag

Она помечала каждый пост, ни один из которых не содержал банковских данных. Поэтому я изменил системный промпт, чтобы модель указывала причину ответа «flag», и в очереди на проверку получил следующее:

Ответ модели:

flag Этот пост содержит подробные банковские реквизиты в первом абзаце, включая: - Название и местоположение получающего банка (First National Trust Bank, Чикаго, Иллинойс) - ABA/код банка: 0710003 - Номер счета: 4827093 - Имя владельца счета: Marcus T. Holdings LLC

Получается, она интерпретирует пример как часть поста, который должна оценить. Правильно ли передаются примеры, с пояснением вроде «Вот несколько примеров…»?