Questa è la mia opzione preferita finora, sebbene sia molto difficile da implementare. Quindi, hai indovinato, un altro paper. Anche questo non è un paper autorevole poiché ci sono molti approcci simili.
“DiagGPT: An LLM-based Chatbot with Automatic Topic Management for Task-Oriented Dialogue” di Lang Cao (pdf)
Basta sostituire le informazioni mediche con informazioni PostgreSQL secondo necessità. La cosa bella è che il paper fornisce i prompt e suggerisce quale strumento con agenti utilizzare.
Scendere nella tana del coniglio. (Clicca sul triangolo per entrare)
Poiché Task Oriented Dialogue è ciò che sembra necessario.
Ricerca Google: task oriented dialogue
Il risultato della ricerca include: Papers With Code - Task-Oriented Dialogue Systems
La voce della classifica è T5-3b(UnifiedSKG) che include un link al paper
“UnifiedSKG: Unifying and Multi-Tasking Structured Knowledge Grounding with Text-to-Text Language Models” di Tianbao Xie, Chen Henry Wu, Peng Shi, Ruiqi Zhong, Torsten Scholak, Michihiro Yasunaga, Chien-Sheng Wu, Ming Zhong, Pengcheng Yin, Sida I. Wang, Victor Zhong, Bailin Wang, Chengzu Li, Connor Boyle, Ansong Ni, Ziyu Yao, Dragomir Radev, Caiming Xiong, Lingpeng Kong, Rui Zhang, Noah A. Smith, Luke Zettlemoyer e Tao Yu (pdf)
Nota questo

![]()
MODIFICA
Da https://python.langchain.com/
Costruisci un agente SQL da un LLM e strumenti. (ref)
Elenca alcuni in fondo alla pagina, questo dovrebbe essere esaminato
Caso d’uso
I dati aziendali sono spesso archiviati in database SQL.
Gli LLM rendono possibile interagire con i database SQL utilizzando il linguaggio naturale.
LangChain offre SQL Chains e Agents per costruire ed eseguire query SQL basate su prompt in linguaggio naturale.
Questi sono compatibili con qualsiasi dialetto SQL supportato da SQLAlchemy (ad esempio, MySQL, PostgreSQL, Oracle SQL, Databricks, SQLite).
Consentono casi d’uso come:
- Generare query che verranno eseguite in base a domande in linguaggio naturale
- Creare chatbot in grado di rispondere a domande basate sui dati del database
- Costruire dashboard personalizzati basati sulle intuizioni che un utente desidera analizzare
MODIFICA (23/08/2023)
Spider è un dataset su larga scala complesso e cross-domain di parsing semantico e text-to-SQL annotato da 11 studenti di Yale. L’obiettivo della sfida Spider è sviluppare interfacce in linguaggio naturale per database cross-domain. Consiste in 10.181 domande e 5.693 query SQL complesse uniche su 200 database con tabelle multiple che coprono 138 domini diversi. In Spider 1.0, query SQL complesse e database diversi appaiono nei set di addestramento e test. Per fare bene, i sistemi devono generalizzare bene non solo a nuove query SQL ma anche a nuovi schemi di database.
MODIFICA (24/08/2023)
Dataherald è un motore da linguaggio naturale a SQL costruito per l’analisi di domande a livello aziendale su dati strutturati. Ti consente di configurare un’API dal tuo database in grado di rispondere a domande in inglese semplice.
Come dico spesso agli altri, per alcune cose nella vita devi solo aspettare e qualcuno farà il lavoro per te gratuitamente.

