Discourse AI + Data Explorer?

На данный момент это мой любимый вариант, хотя его реализация крайне сложна. Как вы уже догадались, это ещё одна статья. Опять же, это не авторитетная работа, так как существует множество аналогичных подходов.

“DiagGPT: LLM-чатбот с автоматическим управлением темами для диалогов, ориентированных на решение задач” от Ланга Цао (pdf)

Просто замените медицинскую информацию на информацию о PostgreSQL по мере необходимости. Приятно то, что в статье приведены промпты и предложено, какие инструменты и агенты использовать.

Спускаясь в кроличью нору. (Нажмите на треугольник, чтобы войти)

Поскольку то, что требуется, — это Task Oriented Dialogue (диалог, ориентированный на решение задач).
Поиск в Google: task oriented dialogue
Результаты поиска включают: Papers With Code - Task-Oriented Dialogue Systems
Запись в лидерборде — T5-3b(UnifiedSKG), которая содержит ссылку на статью
“UnifiedSKG: Объединение и многозадачность структурированного знания на основе текста с использованием текстовых языковых моделей” от Тяньбао Ся, Чен Хенри Ву, Пенг Ши, Жуи Ци Чжун, Торстен Шолак, Мичихиро Ясунга, Чень-Шэн Ву, Мин Чжун, Пенгчэн Инь, Сида И. Ван, Виктор Чжун, Байлинь Ван, Чэнцзу Ли, Коннор Бойл, Ансонг Ни, Цзыюй Яо, Драгомир Радев, Цаймин Сян, Линпэн Конг, Жуи Чжан, Ноа А. Смит, Люк Зеттлмойер и Тао Ю (pdf)

Обратите внимание на это
image

:slightly_smiling_face:


РЕДАКТИРОВАНИЕ

От https://python.langchain.com/

Создание SQL-агента на основе LLM и инструментов. (ссылка)

Внизу страницы перечислено несколько вариантов, на этот стоит обратить внимание

Сценарий использования

Корпоративные данные часто хранятся в базах данных SQL.

LLM позволяют взаимодействовать с базами данных SQL, используя естественный язык.

LangChain предлагает SQL-цепочки и агентов для создания и выполнения SQL-запросов на основе промптов на естественном языке.

Они совместимы с любым диалектом SQL, поддерживаемым SQLAlchemy (например, MySQL, PostgreSQL, Oracle SQL, Databricks, SQLite).

Они позволяют реализовать такие сценарии, как:

  • Генерация запросов, которые будут выполняться на основе вопросов на естественном языке
  • Создание чат-ботов, способных отвечать на вопросы на основе данных базы данных
  • Построение пользовательских дашбордов на основе аналитических данных, которые хочет изучить пользователь

РЕДАКТИРОВАНИЕ (23.08.2023)

Spider — это крупномасштабный набор данных для семантического разбора и перевода текста в SQL сложных и межпредметных запросов, аннотированный 11 студентами Йельского университета. Цель конкурса Spider — разработать интерфейсы на естественном языке для межпредметных баз данных. Он включает 10 181 вопрос и 5 693 уникальных сложных SQL-запроса к 200 базам данных с несколькими таблицами, охватывающим 138 различных предметных областей. В Spider 1.0 различные сложные SQL-запросы и базы данных встречаются в обучающей и тестовой выборках. Чтобы успешно справиться с этим, системы должны хорошо обобщать не только новые SQL-запросы, но и новые схемы баз данных.


РЕДАКТИРОВАНИЕ (24.08.2023)

Dataherald — это движок перевода естественного языка в SQL, созданный для корпоративного уровня ответов на вопросы по структурированным данным. Он позволяет настроить API для вашей базы данных, который может отвечать на вопросы на простом английском языке.

Как я часто говорю другим, в некоторых вещах жизни просто нужно подождать, и кто-то сделает работу за вас бесплатно.

2 лайка