Configurazione delle quote di utilizzo LLM in Discourse AI

sam · 21 Gennaio 2025, 6:04am

Questa guida spiega come configurare e gestire le quote di utilizzo per i modelli linguistici di grandi dimensioni (LLM) in Discourse AI.

Livello utente richiesto: Amministratore

Riepilogo

Le quote di utilizzo degli LLM consentono agli amministratori di controllare e monitorare il consumo di risorse AI impostando limiti sull’utilizzo dei token e sulle interazioni per diversi gruppi di utenti. Ciò aiuta a mantenere l’efficienza dei costi garantendo al contempo un accesso equo alle funzionalità AI nella tua community.

Configurazione

Accesso alle impostazioni delle quote

Naviga nel pannello di amministrazione del tuo sito
Vai su Admin > Plugin > Discourse AI > LLM Models
Seleziona il modello LLM che desideri configurare

Impostazione delle quote

Per ogni gruppo di utenti, puoi configurare:

Utilizzo massimo dei token
E/O Numero massimo di interazioni AI
Durata del periodo di reset

Opzioni di durata

Scegli tra periodi di reset preimpostati:

1 ora
6 ore
24 ore
7 giorni
Durata personalizzata (specificata in ore)

Monitoraggio dell’utilizzo

Visualizzazione delle statistiche

Gli amministratori possono monitorare il consumo di token e l’utilizzo delle interazioni su: https://NOME_SITO/admin/plugins/discourse-ai/ai-usage

Naviga su Admin > Plugin > Discourse AI
Seleziona la scheda “Usage”
Filtra per intervallo di date, gruppo di utenti o metriche specifiche

Esperienza utente

Notifiche sulle quote

Gli utenti ricevono un feedback chiaro quando si avvicinano o raggiungono i limiti di quota:

Stato di utilizzo corrente
Tempo rimanente fino al prossimo reset della quota

Messaggi di errore

Quando una quota viene superata, gli utenti vedono:

Una chiara notifica che il limite di quota è stato raggiunto
Il tempo rimanente fino al prossimo reset della quota

Migliori pratiche

Inizia in modo conservativo: Inizia con quote più basse e regola in base ai modelli di utilizzo effettivi
Allocazione basata su gruppi: Assegna quote diverse in base alle esigenze e ai ruoli dei gruppi di utenti
Monitoraggio regolare: Rivedi i modelli di utilizzo per ottimizzare le impostazioni delle quote
Comunicazione chiara: Informa gli utenti sui limiti di quota e sui periodi di reset

Problemi comuni e soluzioni

Problema: gli utenti raggiungono frequentemente i limiti

Soluzione: Considera:

Aumentare i limiti di quota per gruppi specifici
Ridurre il periodo di reset
Creare gruppi specializzati per utenti ad alto utilizzo

Problema: quote non utilizzate

Soluzione:

Regola i limiti verso il basso per ottimizzare l’allocazione delle risorse
Rivedi le assegnazioni dei gruppi per garantire che le quote corrispondano alle esigenze degli utenti

FAQ

D: Le quote possono essere sospese temporaneamente?
R: Sì, gli amministratori possono disabilitare temporaneamente l’applicazione delle quote per gruppi specifici o per l’intero sito.

D: Le quote non utilizzate vengono riportate?
R: No, le quote vengono resettate completamente alla fine di ogni periodo.

D: Modelli LLM diversi possono avere quote diverse?
R: Sì, le quote possono essere configurate in modo indipendente per ciascun LLM.

D: Cosa succede se vengono impostate più quote per un singolo LLM?
R: Le quote sono basate sul gruppo e applicate per utente. Affinché un utente superi la quota, deve superare la quota in tutti i gruppi. Ciò significa che se agli amministratori viene assegnata una quota molto flessibile e al livello di fiducia 1 una più restrittiva, la quota degli amministratori verrà applicata agli amministratori.

D: Cosa succede se a un LLM non viene applicata alcuna quota?
R: Non succederà nulla di speciale, tutto l’utilizzo dell’LLM non sarà misurato.

D: Cosa succede se voglio quote diverse per funzionalità diverse?
R: Discourse AI ti consente di definire più LLM che contattano tutti lo stesso endpoint e possono persino riutilizzare le chiavi, se desideri assegnare una quota all’AI Helper e un’altra all’AI Bot, definisci 2 LLM.

Risorse aggiuntive

lava · 21 Gennaio 2025, 6:37am

Sembra che non possiamo proibire completamente a un gruppo di utilizzare un modello specifico impostando la quota a 0.

Potresti aggiungere il supporto per questa impostazione?

sam · 21 Gennaio 2025, 6:40am

Mi dispiace, puoi espandere qui. Ogni funzionalità è anche limitata a un gruppo, quindi puoi comunque abilitare l’helper solo per un sottoinsieme di utenti.

lava · 21 Gennaio 2025, 6:50am

Vorrei che alcuni modelli premium fossero riservati solo a gruppi specifici. Sarebbe fantastico se potessimo impostare la quota di un modello a 0 per disabilitare l’accesso a determinati gruppi.

sam · 21 Gennaio 2025, 6:53am

Sì, è un problema interessante. Ci penserò.

Potresti voler che l’assistente utilizzi GPT4o per il “gruppo speciale 1” e GPT4o mini per il resto delle persone.

Al momento, ti consentiamo solo di selezionare un modello per l’assistente AI, quindi sarebbe necessaria una modifica piuttosto importante per supportare questa funzionalità.

@Falco / @Saif / @awesomerobot, qualcosa a cui pensare.

Argomento		Risposte	Visualizzazioni
LLM Quotas for Discourse AI Announcements ai	0	141	Gennaio 21, 2025
Making the case for a hard cap feature on user group AI usage for AI bots and AI Helper Feature chat , completed , ai , ai-bot	12	216	Gennaio 26, 2025
Limit the number of AI tokens a user can use in a day? Feature completed , ai	12	515	Aprile 3, 2025
Balancing Costs and Functionality in AI-Powered Forums Feature ai , ai-bot	4	717	Gennaio 21, 2025
Discourse AI - Large Language Model (LLM) settings page Site Management how-to , ai	20	2692	Novembre 26, 2025