これは今のところ私のお気に入りの選択肢ですが、実装するのは非常に難しいです。そのため、予想通り、もう一つ論文を紹介します。これもまた、多くの類似したアプローチがあるため、権威ある論文ではありません。
Lang Caoによる「DiagGPT: An LLM-based Chatbot with Automatic Topic Management for Task-Oriented Dialogue」(pdf)
必要に応じて、医療情報をPostgreSQL情報に置き換えるだけです。この論文の良い点は、プロンプトが提供されており、どのツールをエージェントと使用すべきかが示唆されていることです。
さらに深く掘り下げる。(三角形をクリックして展開)
必要なのは「タスク指向対話」のようです。
Google検索:「タスク指向対話」
検索結果には以下が含まれます:Papers With Code - Task-Oriented Dialogue Systems
リーダーボードのエントリは「T5-3b(UnifiedSKG)」で、論文へのリンクが含まれています。
Tianbao Xie、Chen Henry Wu、Peng Shi、Ruiqi Zhong、Torsten Scholak、Michihiro Yasunaga、Chien-Sheng Wu、Ming Zhong、Pengcheng Yin、Sida I. Wang、Victor Zhong、Bailin Wang、Chengzu Li、Connor Boyle、Ansong Ni、Ziyu Yao、Dragomir Radev、Caiming Xiong、Lingpeng Kong、Rui Zhang、Noah A. Smith、Luke Zettlemoyer、Tao Yuによる「UnifiedSKG: Unifying and Multi-Tasking Structured Knowledge Grounding with Text-to-Text Language Models」(pdf)
これに注目してください

![]()
編集
https://python.langchain.com/ より
LLMとツールからSQLエージェントを構築します。(参照)
ページの下部にいくつかリストされていますが、このページを見るべきです。
ユースケース
エンタープライズデータはSQLデータベースに保存されていることがよくあります。
LLMを使用すると、自然言語でSQLデータベースと対話できます。
LangChainは、自然言語プロンプトに基づいてSQLクエリを構築および実行するためのSQLチェーンとエージェントを提供します。
これらは、SQLAlchemy(例:MySQL、PostgreSQL、Oracle SQL、Databricks、SQLite)でサポートされている任意のSQL方言と互換性があります。
これらは、次のようなユースケースを可能にします。
- 自然言語の質問に基づいて実行されるクエリの生成
- データベースデータに基づいて質問に回答できるチャットボットの作成
- ユーザーが分析したいインサイトに基づいたカスタムダッシュボードの構築
編集 (2023/08/23)
Spiderは、11人のイェール大学の学生によって注釈が付けられた、大規模な複雑でドメイン横断的なセマンティックパーシングおよびテキストツーSQLデータセットです。Spiderチャレンジの目標は、ドメイン横断的なデータベースへの自然言語インターフェースを開発することです。138の異なるドメインをカバーする200のデータベースに対して、10,181の質問と5,693の複雑なSQLクエリで構成されています。Spider 1.0では、異なる複雑なSQLクエリとデータベースがトレーニングセットとテストセットに登場します。これにうまく対応するには、システムは新しいSQLクエリだけでなく、新しいデータベーススキーマにもうまく汎化する必要があります。
編集 (2023/08/24)
Dataheraldは、構造化データに対するエンタープライズレベルの質問応答のために構築された、自然言語からSQLへのエンジンです。データベースから、平易な英語で質問に答えることができるAPIをセットアップできます。
私がよく他の人に言うように、人生には待っていれば無料で仕事をしてくれる人が現れることもあります。

