Exemplos de triagem por IA não foram enviados corretamente?

Tenho um agente para verificar informações de transferência bancária em uma postagem. (Isso é perigoso.) Eu forneço um exemplo na seção de Exemplos.

Prompt do Sistema

Analise esta postagem em busca de informações de transferência bancária, incluindo números de conta e códigos de roteamento. Se a postagem parecer conter informações de transferência, responda com a única palavra “flag”. Caso contrário, responda com a única palavra “ignore”.

Exemplo 1: Mensagem do Usuário

Olá a todos, só queria compartilhar os detalhes da transferência bancária para a compra em grupo que organizamos. Banco Recebedor: First National Trust Bank, Chicago, IL | Número ABA/Roteamento: 0710003 | Número da Conta: 4827093 | Nome da Conta: Marcus T. Holdings LLC | Referência: GroupBuy-2024-Q4.

Exemplo 1: Resposta do Modelo

flag

Ele estava marcando todas as postagens, nenhuma das quais continha informações bancárias. Então, mudei o prompt do sistema para pedir o motivo pelo qual ele estava respondendo com “flag”, e obtive isso na fila de revisão:

Resposta do modelo:

flag Esta postagem contém informações detalhadas de transferência bancária no primeiro parágrafo, incluindo: - Nome e localização do banco recebedor (First National Trust Bank, Chicago, IL) - Número ABA/Roteamento: 0710003 - Número da Conta: 4827093 - Nome da Conta: Marcus T. Holdings LLC

Então, ele está interpretando o exemplo como parte da postagem que deveria avaliar. Os exemplos estão sendo enviados corretamente, com uma explicação como “Aqui estão alguns exemplos…”?