L'aggiunta di più file persona aumenta i costi delle richieste LLM?

Probabilmente questa è una domanda da principiante, ma mi chiedo se la quantità di informazioni nella configurazione della persona possa avere un impatto sui costi di utilizzo degli LLM come Claude o OpenAI?

Voglio dire, se carico molti file di testo e PDF, ciò aumenterà significativamente il numero di token nelle richieste, rendendo ogni richiesta che utilizza quella persona più costosa rispetto a una richiesta che utilizza una persona senza tanti file (o che cerca meno argomenti nel forum)?

1 Mi Piace

L’aumento dei costi è controllato tramite le seguenti due impostazioni in Persona:

  • Token di caricamento dei blocchi
  • Ricerca di blocchi di conversazione

Quando si utilizza una persona con file, verranno utilizzati

Token di caricamento dei blocchi * Blocchi di conversazione di ricerca

token aggiuntivi. È possibile modificare questi valori per controllare il rapporto costo/qualità.

3 Mi Piace

Grazie mille. Qualcuno ha una buona esperienza su quali valori utilizzare per questi? Non ho idea.

Un PDF di 30 pagine avrebbe circa 7500 parole, forse. Questo potrebbe essere estrapolato a 20000 token.

Supponendo ciò, cosa significherebbe se impostassi Upload chunk tokens con un valore di 2000, ad esempio? “Leggerà e terrà conto solo del 10% del PDF” quando costruirà una risposta?

Lascia i valori predefiniti a meno che tu non abbia un buon motivo per cambiarli. I valori predefiniti di Discourse funzionano per la maggior parte dei casi d’uso.

2 Mi Piace