Discourse AI y retrieval augmented generation

aas · 22 Noviembre, 2023 21:31

¡Discourse AI se ve increíble y estoy súper ansioso por configurarlo en mi instancia autoalojada!

Una pregunta que tengo (o quizás una solicitud de funciones) relacionada con el bot de ayuda y los embeddings es: ¿puedo elegir qué temas se utilizan para la generación aumentada por recuperación (RAG)? Por ejemplo, sería increíble si pudiera configurar el plugin para que solo calcule embeddings para los temas en las categorías de mis documentos oficiales. Temo que si el bot está creando una base de datos vectorial utilizando todo en nuestro foro, la salida no será lo suficientemente buena. También sería interesante configurarlo para que solo calcule embeddings para temas con etiquetas específicas o temas resueltos. Tengo curiosidad sobre los detalles del flujo de trabajo de RAG. ¿Discourse AI tiene un flujo de trabajo de RAG? ¿Tendremos la capacidad de controlar qué documentos se agregan a la base de datos vectorial? Si ya tenemos una colección de embeddings, ¿podemos configurar Discourse AI para que los use al llamar al asistente o a la búsqueda semántica?

Vi esto mencionado brevemente aquí, ¡pero me encantaría saber más detalles!

sam · 22 Noviembre, 2023 22:47

Todavía no, pero me gusta mucho esta solicitud de funciones.

Nuestro comando de búsqueda ahora no tiene ningún parámetro, cuando lo eliges:

Así que la solicitud de función aquí es permitirle especificar algunos parámetros adicionales para varios comandos que agregue. Me gusta mucho, solo necesito pensar en la interfaz de usuario y las estructuras de datos.

tentacleskilt · 23 Noviembre, 2023 09:27

aas:

¡Discourse AI se ve increíble y estoy súper ansioso por configurarlo en mi instancia autoalojada!

Una pregunta que tengo (o quizás una solicitud de función) relacionada con el bot de ayuda y los embeddings es: ¿puedo elegir qué temas se utilizan para la generación aumentada por recuperación (RAG)? Por ejemplo, sería increíble si pudiera configurar el plugin para que solo calcule embeddings para temas en mis categorías de documentación oficial. Temo que si el bot está creando una base de datos vectorial utilizando todo en nuestro foro, la salida no será lo suficientemente buena. También sería interesante configurarlo para que solo calcule embeddings para temas con etiquetas específicas o temas resueltos. Tengo curiosidad por los detalles essay sobre el flujo de trabajo RAG. ¿Discourse AI tiene un flujo de trabajo RAG? ¿Tendremos la capacidad de controlar qué documentos se agregan a la base de datos vectorial? Si ya tenemos una colección de embeddings, ¿podemos configurar Discourse AI para que los use al llamar al asistente o a la búsqueda semántica?

¡Vi esto mencionado brevemente aquí, pero me encantaría saber más detalles!

¿Qué en esta persona se basa en la integración de Discourse, aparte de usar la interfaz de usuario de Discourse como front-end para el LLM externo? Para la mayoría de nuestras personas, estamos buscando hacer RAG, donde podemos crear algo que un LLM listo para usar tampoco te dará.

Hasta donde sé, el plugin Discourse AI solo construye una base de datos vectorial utilizando todas las publicaciones del foro, pero este enfoque se refinará para permitir a los usuarios especificar qué documentos deben incluirse. Esto permitirá un control más granular sobre los datos de entrenamiento y mejorará la calidad de las respuestas generadas.

Además, la capacidad de incorporar embeddings precalculados todavía se está explorando…

sam · 29 Abril, 2024 23:16

Por si acaso, esto ya está implementado

Puedes controlar los parámetros de búsqueda al agregar una herramienta de búsqueda. Si agregas Contribute > Bug, solo se buscarán errores.

Tema		Respuestas	Vistas
RAG capacities of discourse-ai Support ai	6	480	19 Septiembre 2024
API access to the embedding(s) for a post Feature completed	3	553	12 Septiembre 2024
Improving quality of search filters in Discourse AI Support ai	14	777	28 Junio 2024
Discourse AI - AI search Site Management how-to , ai , ai-search	9	3336	2 Julio 2025
Advice on a support bot for a technical support forum (Discourse AI vs Discourse Chatbot) General ai , ai-bot	57	4543	29 Abril 2026

Discourse AI y retrieval augmented generation

Temas relacionados