Discourse AI + Data Explorer?

这是我迄今为止最喜欢的选项,尽管它非常难以实现。因此,你猜对了,又一篇论文。同样,这也不是一篇权威论文,因为有许多类似的方法。

“DiagGPT:一种基于 LLM 的具有自动主题管理功能的面向任务对话的聊天机器人”,作者 Lang Cao(pdf

只需根据需要将医疗信息替换为 PostgreSQL 信息。有趣的是,这篇论文提供了提示,并建议使用哪些工具和代理。

深入研究。 (点击三角形进入)

既然“面向任务对话”似乎是必需的。
Google 搜索:“面向任务对话”
搜索结果包括:Papers With Code - 面向任务的对话系统
排行榜条目是 T5-3b(UnifiedSKG),其中包含一篇论文的链接
“UnifiedSKG:使用文本到文本语言模型统一和多任务结构化知识基础”,作者 Tianbao Xie、Chen Henry Wu、Peng Shi、Ruiqi Zhong、Torsten Scholak、Michihiro Yasunaga、Chien-Sheng Wu、Ming Zhong、Pengcheng Yin、Sida I. Wang、Victor Zhong、Bailin Wang、Chengzu Li、Connor Boyle、Ansong Ni、Ziyu Yao、Dragomir Radev、Caiming Xiong、Lingpeng Kong、Rui Zhang、Noah A. Smith、Luke Zettlemoyer 和 Tao Yu(pdf

请注意这一点
image

:slightly_smiling_face:


编辑

来自 https://python.langchain.com/

从 LLM 和工具构建 SQL 代理。(参考

页面底部列出了几个,应该看一下这个

用例

企业数据通常存储在 SQL 数据库中。

LLM 使能够使用自然语言与 SQL 数据库进行交互。

LangChain 提供 SQL 链和代理,用于根据自然语言提示构建和运行 SQL 查询。

这些与 SQLAlchemy 支持的任何 SQL 方言兼容(例如,MySQL、PostgreSQL、Oracle SQL、Databricks、SQLite)。

它们支持以下用例:

  • 根据自然语言问题生成将要运行的查询
  • 创建可以根据数据库数据回答问题的聊天机器人
  • 构建基于用户想要分析的见解的自定义仪表板

编辑(2023 年 8 月 23 日)

Spider 是一个大型的复杂且跨领域语义解析和文本到 SQL 数据集,由 11 名耶鲁学生注释。Spider 挑战的目标是开发跨领域数据库的自然语言接口。它包含 10,181 个问题和 5,693 个复杂的唯一 SQL 查询,涵盖 200 个数据库,其中包含涵盖 138 个不同领域的多个表。在 Spider 1.0 中,不同的复杂 SQL 查询和数据库出现在训练集和测试集中。要在此取得好成绩,系统必须能够很好地泛化到新的 SQL 查询以及新的数据库模式


编辑(2023 年 8 月 24 日)

Dataherald 是一个面向企业级结构化数据问答的自然语言到 SQL 引擎。它允许您从数据库设置一个 API,该 API 可以用纯英语回答问题。

正如我经常告诉别人的那样,生活中有些事情你只需要等待,就会有人免费为你做。

2 个赞