¡Discourse AI se ve increíble y estoy súper ansioso por configurarlo en mi instancia autoalojada!
Una pregunta que tengo (o quizás una solicitud de funciones) relacionada con el bot de ayuda y los embeddings es: ¿puedo elegir qué temas se utilizan para la generación aumentada por recuperación (RAG)? Por ejemplo, sería increíble si pudiera configurar el plugin para que solo calcule embeddings para los temas en las categorías de mis documentos oficiales. Temo que si el bot está creando una base de datos vectorial utilizando todo en nuestro foro, la salida no será lo suficientemente buena. También sería interesante configurarlo para que solo calcule embeddings para temas con etiquetas específicas o temas resueltos. Tengo curiosidad sobre los detalles del flujo de trabajo de RAG. ¿Discourse AI tiene un flujo de trabajo de RAG? ¿Tendremos la capacidad de controlar qué documentos se agregan a la base de datos vectorial? Si ya tenemos una colección de embeddings, ¿podemos configurar Discourse AI para que los use al llamar al asistente o a la búsqueda semántica?
Vi esto mencionado brevemente aquí, ¡pero me encantaría saber más detalles!
Así que la solicitud de función aquí es permitirle especificar algunos parámetros adicionales para varios comandos que agregue. Me gusta mucho, solo necesito pensar en la interfaz de usuario y las estructuras de datos.
Hasta donde sé, el plugin Discourse AI solo construye una base de datos vectorial utilizando todas las publicaciones del foro, pero este enfoque se refinará para permitir a los usuarios especificar qué documentos deben incluirse. Esto permitirá un control más granular sobre los datos de entrenamiento y mejorará la calidad de las respuestas generadas.
Además, la capacidad de incorporar embeddings precalculados todavía se está explorando…