O problema é que apenas fornecer o esquema não é informação suficiente para o ChatGPT. Você precisa fornecer detalhes sobre coisas como:
- o que os códigos inteiros de
req_typeemapplication_requestssignificam - para que serve a coluna
user_idemtopics - o que os códigos de
action_typena tabelauser_actionssignificam e qual a diferença entre as colunasuser_id,target_user_ideacting_user_iddessa tabela
Com esses tipos de detalhes, o GPT 3.5 parece fazer um bom trabalho sem nenhum treinamento adicional. O problema então se torna que fornecer esse nível de detalhe sobre todo o banco de dados resultará no prompt excedendo o limite de tokens do ChatGPT (4096 tokens, incluindo o texto do prompt e a saída gerada). Se esse tipo de abordagem fosse usada, haveria a necessidade de uma maneira de limitar o que é enviado no prompt com base nas informações que o usuário queria obter da consulta do Data Explorer.