Ingegnerizzare una persona su cui fare affidamento nella cronologia della chat

jrgong · 27 Luglio 2025, 4:29pm

Domanda veloce: quale sarebbe una struttura “migliore” per il nostro caso d’uso?

Abbiamo un sacco di log della cronologia delle chat esportati dai canali Slack che contengono molto know-how, problemi menzionati e soluzioni, ecc. Ovviamente quelle chat contengono un sacco di “fuffa” inutile che sarebbe antieconomico scaricare in argomenti/post e far utilizzare all’AI bot.

Abbiamo circa 10 file, ciascuno di circa 1-2 MB. In termini di utilizzo della persona AI, ci saranno solo circa 30 persone che effettueranno circa 10 chat al giorno (difficile stimare il volume dei token qui).

A questo punto mi chiedo quale sia un approccio 80/20 ragionevole per utilizzare quei log di chat mantenendolo in qualche modo economico. Si è ridotto a 2 opzioni:

Copia e incolla i log in argomenti/post di Discourse: Veloce e sporco, non richiede sviluppo personalizzato, potrebbe comportare costi API elevati.
Pre-elaborare in qualche modo i log della chat e metterli in un formato o struttura corretta e caricarli nella persona.
O forse una qualche forma ibrida: Con ogni richiesta del bot AI, valutare e salvare l’output come file txt e poi caricarlo nella persona.

Quale opzione consigliate? O forse qualcosa di completamente diverso?

sam · 29 Luglio 2025, 5:36am

Consiglierei il seguente approccio:

Elaborare i 10 file utilizzando una persona “Creativa” con un LLM a contesto ampio / output ampio come Sonnet 4 thinking. L’obiettivo di questa elaborazione sarebbe quello di “riordinare” le informazioni e prepararle per un RAG
Quindi, utilizzando il nostro caricamento integrato, caricare i 10 file elaborati in una persona, in modo che RAG possa cercare nel contenuto.

Dato che ci sono tonnellate di dati qui, sconsiglio di riempire un prompt di sistema. Come linea guida, un prompt di sistema non dovrebbe essere molto lungo, diventa costoso. 10k token sono fattibili, 100k token non sono fattibili con gli attuali LLM di frontiera. Ogni interazione ti costerà troppo e gli LLM si confonderanno ulteriormente.

jrgong · 29 Luglio 2025, 7:35am

Grazie, è d’aiuto!

Solo per chiarire, tutti i file caricati vengono inseriti nel prompt di sistema? Oppure vengono prima elaborati attraverso il ai_embeddings_model configurato e poi inseriti?

Sono un po’ confuso riguardo alla tua raccomandazione di un limite di 10k token, specialmente con la parte sottostante:

sam · 29 Luglio 2025, 8:04am

I file in Discourse AI Persona, upload support sono limitati solo dalla dimensione del tuo caricamento, possono essere enormi, vengono elaborati tramite embedding, iniettiamo blocchi nel prompt per configurazione.

Quello di cui stavo parlando era cercare di forzare tutte le informazioni in un unico prompt di sistema qui:

che è limitato…

jrgong · 29 Luglio 2025, 8:08am

Ah, questo chiarisce le cose, grazie!

Quindi, in pratica, i miei prossimi passi dovrebbero essere eseguire alcuni test con diversi modelli di embedding e vedere quale dimensione di token finisco per iniettare nel prompt di sistema, giusto?

sam · 29 Luglio 2025, 9:22am

Il modello di embedding controlla la qualità, non la quantità
puoi aggregare tutti i tuoi dati in un unico file, li divideremo in background e recupereremo i pezzi più pertinenti da aggiungere al tuo prompt
sperimentare qui significherebbe migliorare i risultati, alcune pulizie potrebbero funzionare meglio di altre, alcuni modelli di embedding saranno più intelligenti nel trovare pezzi più pertinenti

jrgong · 29 Luglio 2025, 10:08am

Grazie Sam, lo apprezzo molto

Se hai altre risorse utili, sentiti libero di condividerle qui. Una volta che farò progressi, proverò a pubblicare la mia esperienza qui su meta.

jrgong · 11 Agosto 2025, 8:50am

@sam come suggerisci di aggiungere numeri di versione o modello ai separatori di metadati?

Il tuo esempio originale:

[[metadati sui gatti]]
una lunga storia sui gatti
[[metadati sui cani]]
una lunga storia sui cani

Ora, se vogliamo arricchirli con numeri di versione o numeri di modello specifici, devo usare lo stesso formato o struttura che gli umani userebbero quando li digitano?

Ad esempio:

[[metadati sui gatti v1.0]]
una lunga storia sui gatti
[[metadati sui cani]]
una lunga storia sui cani
[[metadati sui gatti xxl v2.1]]
una lunga storia sui gatti
[[metadati sui cani v 1.1beta]]
una lunga storia sui cani

Inoltre, quando i numeri di versione sono mancanti nei metadati (vedi metadati sui cani), quel blocco verrebbe utilizzato in una risposta per tutte le richieste relative ai cani, indipendentemente dalla “versione del cane”?

sam · 11 Agosto 2025, 10:59pm

Sì, questo è il modo giusto!

Argomento		Risposte	Visualizzazioni
Discourse AI Persona, upload support Announcements ai , ai-bot	21	1563	Settembre 11, 2025
AI bot - Chat and PM integration Site Management chat , how-to , ai , ai-bot	8	1037	Ottobre 24, 2024
Creating custom AI Bot personas Feature completed , ai , ai-bot	12	3464	Novembre 23, 2023
AI bot - Personas Site Management how-to , ai , ai-bot	23	2503	Ottobre 10, 2025
[Ai Bot] Add user token tracking, custom AI personas, max context posts, document loading, custom API URLs, and localized chat titles Feature ai , ai-bot	2	489	Marzo 22, 2024

Ingegnerizzare una persona su cui fare affidamento nella cronologia della chat

Argomenti correlati