Essa é a minha opção favorita até agora, embora seja muito difícil de implementar. Assim, você adivinhou, outro artigo. Novamente, este não é um artigo autoritativo, pois existem muitas abordagens semelhantes.
“DiagGPT: An LLM-based Chatbot with Automatic Topic Management for Task-Oriented Dialogue” por Lang Cao (pdf)
Basta substituir as informações médicas por informações do PostgreSQL conforme necessário. A parte interessante é que o artigo fornece os prompts e sugere qual ferramenta com agentes usar.
Descendo a toca do coelho. (Clique no triângulo para entrar)
Como Task Oriented Dialogue é o que parece ser necessário.
Pesquisa no Google: task oriented dialogue
O resultado da pesquisa inclui: Papers With Code - Task-Oriented Dialogue Systems
A entrada no placar é T5-3b(UnifiedSKG) que inclui um link para o artigo
“UnifiedSKG: Unifying and Multi-Tasking Structured Knowledge Grounding with Text-to-Text Language Models” por Tianbao Xie, Chen Henry Wu, Peng Shi, Ruiqi Zhong, Torsten Scholak, Michihiro Yasunaga, Chien-Sheng Wu, Ming Zhong, Pengcheng Yin, Sida I. Wang, Victor Zhong, Bailin Wang, Chengzu Li, Connor Boyle, Ansong Ni, Ziyu Yao, Dragomir Radev, Caiming Xiong, Lingpeng Kong, Rui Zhang, Noah A. Smith, Luke Zettlemoyer e Tao Yu (pdf)
Note isto

![]()
EDIT
De https://python.langchain.com/
Construa um agente SQL a partir de um LLM e ferramentas. (ref)
Ele lista alguns na parte inferior da página, este deve ser observado
Caso de uso
Os dados corporativos são frequentemente armazenados em bancos de dados SQL.
LLMs possibilitam a interação com bancos de dados SQL usando linguagem natural.
LangChain oferece Cadeias e Agentes SQL para construir e executar consultas SQL com base em prompts de linguagem natural.
Eles são compatíveis com qualquer dialeto SQL suportado pelo SQLAlchemy (por exemplo, MySQL, PostgreSQL, Oracle SQL, Databricks, SQLite).
Eles permitem casos de uso como:
- Gerar consultas que serão executadas com base em perguntas em linguagem natural
- Criar chatbots que podem responder a perguntas com base em dados do banco de dados
- Construir painéis personalizados com base em insights que um usuário deseja analisar
EDIT (23/08/2023)
Spider é um conjunto de dados de parsing semântico complexo e entre domínios em larga escala e text-to-SQL anotado por 11 alunos de Yale. O objetivo do desafio Spider é desenvolver interfaces de linguagem natural para bancos de dados entre domínios. Ele consiste em 10.181 perguntas e 5.693 consultas SQL complexas exclusivas em 200 bancos de dados com várias tabelas cobrindo 138 domínios diferentes. No Spider 1.0, diferentes consultas SQL complexas e bancos de dados aparecem nos conjuntos de treinamento e teste. Para ter um bom desempenho, os sistemas devem generalizar bem não apenas para novas consultas SQL, mas também para novos esquemas de banco de dados.
EDIT (24/08/2023)
Dataherald é um motor de linguagem natural para SQL construído para questionamento em nível corporativo sobre dados estruturados. Ele permite que você configure uma API a partir do seu banco de dados que pode responder a perguntas em inglês simples.
Como costumo dizer a outros, para algumas coisas na vida, você só precisa esperar e alguém fará o trabalho de graça.

