Le problème est que le simple fait de fournir le schéma ne suffit pas pour ChatGPT. Vous devez lui fournir des détails sur des éléments tels que :
- ce que représentent les codes entiers de
req_typedansapplication_requests - à quoi sert la colonne
user_iddanstopics - ce que représentent les codes de
action_typedans la tableuser_actionset quelle est la différence entre les colonnesuser_id,target_user_idetacting_user_idde cette table
Avec ces types de détails, GPT 3.5 semble faire un bon travail sans formation supplémentaire. Le problème devient alors que la fourniture de ce niveau de détail sur l’ensemble de la base de données entraînera le dépassement de la limite de jetons de ChatGPT (4096 jetons, incluant le texte du prompt et la sortie générée). Si ce type d’approche était utilisé, il faudrait un moyen de limiter ce qui est inclus dans le prompt en fonction des informations que l’utilisateur souhaitait obtenir de la requête Data Explorer.