Configurazione delle quote di utilizzo LLM in Discourse AI

:bookmark: Questa guida spiega come configurare e gestire le quote di utilizzo per i modelli linguistici di grandi dimensioni (LLM) in Discourse AI.

:person_raising_hand: Livello utente richiesto: Amministratore

Riepilogo

Le quote di utilizzo degli LLM consentono agli amministratori di controllare e monitorare il consumo di risorse AI impostando limiti sull’utilizzo dei token e sulle interazioni per diversi gruppi di utenti. Ciò aiuta a mantenere l’efficienza dei costi garantendo al contempo un accesso equo alle funzionalità AI nella tua community.

Configurazione

Accesso alle impostazioni delle quote

  1. Naviga nel pannello di amministrazione del tuo sito
  2. Vai su Admin > Plugin > Discourse AI > LLM Models
  3. Seleziona il modello LLM che desideri configurare

Impostazione delle quote

Per ogni gruppo di utenti, puoi configurare:

  • Utilizzo massimo dei token
  • E/O Numero massimo di interazioni AI
  • Durata del periodo di reset

Opzioni di durata

Scegli tra periodi di reset preimpostati:

  • 1 ora
  • 6 ore
  • 24 ore
  • 7 giorni
  • Durata personalizzata (specificata in ore)

Monitoraggio dell’utilizzo

Visualizzazione delle statistiche

Gli amministratori possono monitorare il consumo di token e l’utilizzo delle interazioni su: https://NOME_SITO/admin/plugins/discourse-ai/ai-usage

  1. Naviga su Admin > Plugin > Discourse AI
  2. Seleziona la scheda “Usage”
  3. Filtra per intervallo di date, gruppo di utenti o metriche specifiche

Esperienza utente

Notifiche sulle quote

Gli utenti ricevono un feedback chiaro quando si avvicinano o raggiungono i limiti di quota:

  • Stato di utilizzo corrente
  • Tempo rimanente fino al prossimo reset della quota

Messaggi di errore

Quando una quota viene superata, gli utenti vedono:

  • Una chiara notifica che il limite di quota è stato raggiunto
  • Il tempo rimanente fino al prossimo reset della quota

Migliori pratiche

  1. Inizia in modo conservativo: Inizia con quote piĂą basse e regola in base ai modelli di utilizzo effettivi
  2. Allocazione basata su gruppi: Assegna quote diverse in base alle esigenze e ai ruoli dei gruppi di utenti
  3. Monitoraggio regolare: Rivedi i modelli di utilizzo per ottimizzare le impostazioni delle quote
  4. Comunicazione chiara: Informa gli utenti sui limiti di quota e sui periodi di reset

Problemi comuni e soluzioni

Problema: gli utenti raggiungono frequentemente i limiti

Soluzione: Considera:

  • Aumentare i limiti di quota per gruppi specifici
  • Ridurre il periodo di reset
  • Creare gruppi specializzati per utenti ad alto utilizzo

Problema: quote non utilizzate

Soluzione:

  • Regola i limiti verso il basso per ottimizzare l’allocazione delle risorse
  • Rivedi le assegnazioni dei gruppi per garantire che le quote corrispondano alle esigenze degli utenti

FAQ

D: Le quote possono essere sospese temporaneamente?
R: Sì, gli amministratori possono disabilitare temporaneamente l’applicazione delle quote per gruppi specifici o per l’intero sito.

D: Le quote non utilizzate vengono riportate?
R: No, le quote vengono resettate completamente alla fine di ogni periodo.

D: Modelli LLM diversi possono avere quote diverse?
R: Sì, le quote possono essere configurate in modo indipendente per ciascun LLM.

D: Cosa succede se vengono impostate piĂą quote per un singolo LLM?
R: Le quote sono basate sul gruppo e applicate per utente. Affinché un utente superi la quota, deve superare la quota in tutti i gruppi. Ciò significa che se agli amministratori viene assegnata una quota molto flessibile e al livello di fiducia 1 una più restrittiva, la quota degli amministratori verrà applicata agli amministratori.

D: Cosa succede se a un LLM non viene applicata alcuna quota?
R: Non succederà nulla di speciale, tutto l’utilizzo dell’LLM non sarà misurato.

D: Cosa succede se voglio quote diverse per funzionalitĂ  diverse?
R: Discourse AI ti consente di definire più LLM che contattano tutti lo stesso endpoint e possono persino riutilizzare le chiavi, se desideri assegnare una quota all’AI Helper e un’altra all’AI Bot, definisci 2 LLM.

Risorse aggiuntive

10 Mi Piace

Sembra che non possiamo proibire completamente a un gruppo di utilizzare un modello specifico impostando la quota a 0.

Potresti aggiungere il supporto per questa impostazione?

Mi dispiace, puoi espandere qui. Ogni funzionalità è anche limitata a un gruppo, quindi puoi comunque abilitare l’helper solo per un sottoinsieme di utenti.

Vorrei che alcuni modelli premium fossero riservati solo a gruppi specifici. Sarebbe fantastico se potessimo impostare la quota di un modello a 0 per disabilitare l’accesso a determinati gruppi.

2 Mi Piace

Sì, è un problema interessante. Ci penserò.

Potresti voler che l’assistente utilizzi GPT4o per il “gruppo speciale 1” e GPT4o mini per il resto delle persone.

Al momento, ti consentiamo solo di selezionare un modello per l’assistente AI, quindi sarebbe necessaria una modifica piuttosto importante per supportare questa funzionalità.

@Falco / @Saif / @awesomerobot, qualcosa a cui pensare.

5 Mi Piace