C’est mon option préférée jusqu’à présent, bien qu’elle soit très difficile à mettre en œuvre. Ainsi, vous l’avez deviné, un autre article. Encore une fois, ce n’est pas un article faisant autorité car il existe de nombreuses approches similaires.
« DiagGPT : Un chatbot basé sur LLM avec gestion automatique des sujets pour le dialogue orienté tâche » par Lang Cao (pdf)
Remplacez simplement les informations médicales par des informations PostgreSQL selon les besoins. L’avantage est que l’article fournit les invites et suggère quels outils avec des agents utiliser.
Plonger dans le terrier du lapin. (Cliquez sur le triangle pour entrer)
Puisque le « dialogue orienté tâche » semble être ce qui est nécessaire.
Recherche Google : dialogue orienté tâche
Le résultat de la recherche comprend : Papers With Code - Systèmes de dialogue orientés tâche
L’entrée du classement est T5-3b(UnifiedSKG) qui comprend un lien vers l’article
« UnifiedSKG : Unification et tâches multiples de la structuration des connaissances avec les modèles de langage texte-à-texte » par Tianbao Xie, Chen Henry Wu, Peng Shi, Ruiqi Zhong, Torsten Scholak, Michihiro Yasunaga, Chien-Sheng Wu, Ming Zhong, Pengcheng Yin, Sida I. Wang, Victor Zhong, Bailin Wang, Chengzu Li, Connor Boyle, Ansong Ni, Ziyu Yao, Dragomir Radev, Caiming Xiong, Lingpeng Kong, Rui Zhang, Noah A. Smith, Luke Zettlemoyer et Tao Yu (pdf)
Notez ceci

![]()
EDIT
Depuis https://python.langchain.com/
Construisez un agent SQL à partir d’un LLM et d’outils. (ref)
Il en liste quelques-uns en bas de la page, celui-ci devrait être examiné
Cas d’utilisation
Les données d’entreprise sont souvent stockées dans des bases de données SQL.
Les LLM permettent d’interagir avec les bases de données SQL en langage naturel.
LangChain propose des chaînes et des agents SQL pour créer et exécuter des requêtes SQL basées sur des invites en langage naturel.
Ils sont compatibles avec n’importe quel dialecte SQL pris en charge par SQLAlchemy (par exemple, MySQL, PostgreSQL, Oracle SQL, Databricks, SQLite).
Ils permettent des cas d’utilisation tels que :
- Générer des requêtes qui seront exécutées en fonction de questions en langage naturel
- Créer des chatbots capables de répondre à des questions basées sur les données de la base de données
- Construire des tableaux de bord personnalisés basés sur les informations qu’un utilisateur souhaite analyser
EDIT (23/08/2023)
Spider est un ensemble de données à grande échelle de parsing sémantique complexe et inter-domaines et de texte-vers-SQL annoté par 11 étudiants de Yale. L’objectif du défi Spider est de développer des interfaces en langage naturel pour des bases de données inter-domaines. Il se compose de 10 181 questions et 5 693 requêtes SQL complexes uniques sur 200 bases de données avec plusieurs tables couvrant 138 domaines différents. Dans Spider 1.0, différentes requêtes SQL complexes et bases de données apparaissent dans les ensembles d’entraînement et de test. Pour bien y performer, les systèmes doivent généraliser correctement non seulement aux nouvelles requêtes SQL, mais aussi aux nouveaux schémas de base de données.
EDIT (24/08/2023)
Dataherald est un moteur de langage naturel vers SQL conçu pour la réponse aux questions au niveau de l’entreprise sur des données structurées. Il vous permet de configurer une API à partir de votre base de données qui peut répondre à des questions en anglais courant.
Comme je le dis souvent aux autres, pour certaines choses dans la vie, il faut juste attendre et quelqu’un fera le travail gratuitement.

