Les exemples de tri par IA ne sont-ils pas envoyés correctement ?

J’ai un agent pour vérifier les informations de virement bancaire dans un message. (C’est dangereux.) Je lui fournis un exemple dans la section Exemples.

Prompt système

Examinez ce message pour détecter les informations de virement bancaire, notamment les numéros de compte et les codes de routing. Si le message semble contenir des informations de virement, répondez par le seul mot « flag ». Sinon, répondez par le seul mot « ignore ».

Exemple 1 – Message utilisateur

Bonjour à tous, je voulais simplement partager les détails du virement pour l’achat groupé que nous avons organisé. Banque bénéficiaire : First National Trust Bank, Chicago, IL | Numéro ABA/Routing : 0710003 | Numéro de compte : 4827093 | Nom du compte : Marcus T. Holdings LLC | Référence : GroupBuy-2024-Q4.

Exemple 1 – Réponse du modèle

flag

Il marquait tous les messages, aucun ne contenant d’informations bancaires. J’ai donc modifié le prompt système pour qu’il m’indique la raison de sa réponse « flag », et j’ai obtenu ceci dans la file d’examen :

Réponse du modèle :

flag Ce message contient des informations détaillées de virement bancaire dans le premier paragraphe, notamment : - Nom et localisation de la banque bénéficiaire (First National Trust Bank, Chicago, IL) - Numéro ABA/Routing : 0710003 - Numéro de compte : 4827093 - Nom du compte : Marcus T. Holdings LLC

Il interprète donc l’exemple comme faisant partie du message qu’il doit évaluer. Les exemples sont-ils envoyés correctement, avec une explication du type « Voici quelques exemples… » ?