Discourse AI + Data Explorer?

Esa es mi opción favorita hasta ahora, aunque es muy difícil de implementar. Por lo tanto, lo adivinaste, otro artículo. De nuevo, este no es un artículo autoritativo, ya que hay muchos enfoques similares.

“DiagGPT: Un chatbot basado en LLM con gestión automática de temas para diálogos orientados a tareas” por Lang Cao (pdf)

Simplemente reemplace la información médica con información de PostgreSQL según sea necesario. Lo bueno es que el artículo proporciona los prompts y sugiere qué herramienta con agentes usar.

Bajando por la madriguera. (Haz clic en el triángulo para entrar)

Dado que Diálogo orientado a tareas es lo que parece ser necesario.
Búsqueda en Google: diálogo orientado a tareas
El resultado de la búsqueda incluye: Papers With Code - Sistemas de diálogo orientados a tareas
La entrada de la tabla de clasificación es T5-3b(UnifiedSKG) que incluye un enlace al artículo
“UnifiedSKG: Unificación y multi-tarea de la conexión de conocimiento estructurado con modelos de lenguaje de texto a texto” por Tianbao Xie, Chen Henry Wu, Peng Shi, Ruiqi Zhong, Torsten Scholak, Michihiro Yasunaga, Chien-Sheng Wu, Ming Zhong, Pengcheng Yin, Sida I. Wang, Victor Zhong, Bailin Wang, Chengzu Li, Connor Boyle, Ansong Ni, Ziyu Yao, Dragomir Radev, Caiming Xiong, Lingpeng Kong, Rui Zhang, Noah A. Smith, Luke Zettlemoyer y Tao Yu (pdf)

Nota esto
image

:slightly_smiling_face:


EDITAR

Desde https://python.langchain.com/

Construye un agente SQL a partir de un LLM y herramientas. (ref)

Enumera algunos en la parte inferior de la página, este debería ser revisado

Caso de uso

Los datos empresariales a menudo se almacenan en bases de datos SQL.

Los LLM hacen posible interactuar con bases de datos SQL utilizando lenguaje natural.

LangChain ofrece Cadenas y Agentes SQL para construir y ejecutar consultas SQL basadas en prompts de lenguaje natural.

Estos son compatibles con cualquier dialecto SQL compatible con SQLAlchemy (por ejemplo, MySQL, PostgreSQL, Oracle SQL, Databricks, SQLite).

Permiten casos de uso como:

  • Generar consultas que se ejecutarán basándose en preguntas en lenguaje natural
  • Crear chatbots que puedan responder preguntas basándose en datos de bases de datos
  • Construir paneles personalizados basándose en los insights que un usuario desea analizar

EDITAR (23/08/2023)

Spider es un conjunto de datos de análisis semántico y texto-a-SQL a gran escala complejo y de dominio cruzado anotado por 11 estudiantes de Yale. El objetivo del desafío Spider es desarrollar interfaces de lenguaje natural para bases de datos de dominio cruzado. Consta de 10.181 preguntas y 5.693 consultas SQL complejas únicas sobre 200 bases de datos con múltiples tablas que cubren 138 dominios diferentes. En Spider 1.0, aparecen diferentes consultas SQL complejas y bases de datos en los conjuntos de entrenamiento y prueba. Para hacerlo bien, los sistemas deben generalizar bien no solo a nuevas consultas SQL sino también a nuevos esquemas de bases de datos.


EDITAR (24/08/2023)

Dataherald es un motor de lenguaje natural a SQL construido para la respuesta a preguntas a nivel empresarial sobre datos estructurados. Le permite configurar una API desde su base de datos que puede responder preguntas en inglés claro.

Como a menudo les digo a otros, para algunas cosas en la vida solo tienes que esperar y alguien hará el trabajo por ti gratis.

2 Me gusta