Discourse AI sembra fantastico e non vedo l’ora di configurarlo sulla mia istanza self-hosted!
Una domanda che ho (o forse una richiesta di funzionalità) relativa al bot helper e agli embedding è: posso scegliere quali argomenti vengono utilizzati per la generazione aumentata da recupero (RAG)? Ad esempio, sarebbe fantastico se potessi configurare il plugin per calcolare gli embedding solo per gli argomenti nelle nostre categorie di documentazione ufficiale. Temo che se il bot crea un database vettoriale utilizzando tutto ciò che è presente sul nostro forum, l’output non sarà abbastanza buono. Sarebbe anche interessante configurarlo per calcolare gli embedding solo per argomenti con tag specifici o argomenti risolti. Sono curioso dei dettagli sul flusso di lavoro RAG. Discourse AI ha un flusso di lavoro RAG? Avremo la possibilità di controllare quali documenti vengono aggiunti al database vettoriale? Se abbiamo già una raccolta di embedding, possiamo configurare Discourse AI per utilizzarli quando si chiama l’helper o la ricerca semantica?
Ho visto questo menzionato brevemente qui, ma mi piacerebbe saperne di più!
Quindi la richiesta di funzionalità qui è di permetterti di specificare alcuni parametri aggiuntivi per i vari comandi che aggiungi. Mi piace molto, devo solo pensare all’interfaccia utente e alle strutture dati.
Per quanto ne so, il plugin Discourse AI costruisce un database vettoriale utilizzando tutti i post del forum, ma questo approccio verrà perfezionato per consentire agli utenti di specificare quali documenti includere. Ciò consentirà un controllo più granulare sui dati di addestramento e migliorerà la qualità delle risposte generate.
Inoltre, la possibilità di incorporare embedding pre-calcolati è ancora in fase di esplorazione…