Discourse AI e retrieval augmented generation

aas · 22 Novembre 2023, 9:31pm

Discourse AI sembra fantastico e non vedo l’ora di configurarlo sulla mia istanza self-hosted!

Una domanda che ho (o forse una richiesta di funzionalità) relativa al bot helper e agli embedding è: posso scegliere quali argomenti vengono utilizzati per la generazione aumentata da recupero (RAG)? Ad esempio, sarebbe fantastico se potessi configurare il plugin per calcolare gli embedding solo per gli argomenti nelle nostre categorie di documentazione ufficiale. Temo che se il bot crea un database vettoriale utilizzando tutto ciò che è presente sul nostro forum, l’output non sarà abbastanza buono. Sarebbe anche interessante configurarlo per calcolare gli embedding solo per argomenti con tag specifici o argomenti risolti. Sono curioso dei dettagli sul flusso di lavoro RAG. Discourse AI ha un flusso di lavoro RAG? Avremo la possibilità di controllare quali documenti vengono aggiunti al database vettoriale? Se abbiamo già una raccolta di embedding, possiamo configurare Discourse AI per utilizzarli quando si chiama l’helper o la ricerca semantica?

Ho visto questo menzionato brevemente qui, ma mi piacerebbe saperne di più!

sam · 22 Novembre 2023, 10:47pm

Non ancora, ma mi piace molto questa richiesta di funzionalità.

Il nostro comando di ricerca ora non ha parametri, quando lo scegli:

Quindi la richiesta di funzionalità qui è di permetterti di specificare alcuni parametri aggiuntivi per i vari comandi che aggiungi. Mi piace molto, devo solo pensare all’interfaccia utente e alle strutture dati.

tentacleskilt · 23 Novembre 2023, 9:27am

aas:

Discourse AI sembra fantastico e sono super ansioso di configurarlo sulla mia istanza self-hosted!

Una domanda che ho (o forse una richiesta di funzionalità) relativa al bot helper e agli embedding è: posso scegliere quali argomenti vengono utilizzati per la generazione aumentata da recupero (RAG)? Ad esempio, sarebbe fantastico se potessi configurare il plugin per calcolare gli embedding solo per gli argomenti nelle mie categorie di documentazione ufficiale. Temo che se il bot costruisce un database vettoriale utilizzando tutto sul nostro forum, l’output non sarà abbastanza buono. Sarebbe anche interessante configurarlo per calcolare gli embedding solo per argomenti con tag specifici o argomenti risolti. Sono curioso dei dettagli saggio sul flusso di lavoro RAG. Discourse AI ha un flusso di lavoro RAG? Avremo la possibilità di controllare quali documenti vengono aggiunti al database vettoriale? Se abbiamo già una raccolta di embedding, possiamo configurare Discourse AI per utilizzarli quando chiamiamo l’helper o la ricerca semantica?

Ho visto questo brevemente menzionato qui, ma mi piacerebbe saperne di più!

Cosa in questa persona si basa sull’integrazione di Discourse, oltre all’utilizzo dell’interfaccia utente di Discourse come front-end per l’LLM esterno? Per la maggior parte delle nostre persone stiamo cercando di fare RAG, dove possiamo creare qualcosa che utilizzando un LLM “out of the shelf” non ti darà anche.

Per quanto ne so, il plugin Discourse AI costruisce un database vettoriale utilizzando tutti i post del forum, ma questo approccio verrà perfezionato per consentire agli utenti di specificare quali documenti includere. Ciò consentirà un controllo più granulare sui dati di addestramento e migliorerà la qualità delle risposte generate.

Inoltre, la possibilità di incorporare embedding pre-calcolati è ancora in fase di esplorazione…

sam · 29 Aprile 2024, 11:16pm

Per tua informazione, questo è stato implementato ora

Puoi controllare i parametri di ricerca quando aggiungi uno strumento di ricerca. Se aggiungi Contribute > Bug, verranno cercati solo i bug.

Argomento		Risposte	Visualizzazioni
RAG capacities of discourse-ai Support ai	6	479	Settembre 19, 2024
API access to the embedding(s) for a post Feature completed	3	551	Settembre 12, 2024
Improving quality of search filters in Discourse AI Support ai	14	773	Giugno 28, 2024
Discourse AI - AI search Site Management how-to , ai , ai-search	9	3318	Luglio 2, 2025
Advice on a support bot for a technical support forum (Discourse AI vs Discourse Chatbot) General ai , ai-bot	57	4539	Aprile 29, 2026

Discourse AI e retrieval augmented generation

Argomenti correlati