Esta guía explica cómo configurar y administrar las cuotas de uso para Modelos de Lenguaje Grandes (LLM) en Discourse AI.
Nivel de usuario requerido: Administrador
Resumen
Las cuotas de uso de LLM permiten a los administradores controlar y monitorear el consumo de recursos de IA estableciendo límites en el uso de tokens e interacciones para diferentes grupos de usuarios. Esto ayuda a mantener la eficiencia de costos y, al mismo tiempo, garantiza un acceso justo a las funciones de IA en toda su comunidad.
Configuración
Acceso a la configuración de cuotas
- Navegue al panel de administración de su sitio
- Vaya a
Admin > Plugins > Discourse AI > LLM Models - Seleccione el modelo LLM que desea configurar
Configuración de cuotas
Para cada grupo de usuarios, puede configurar:
- Uso máximo de tokens
- Y/O número máximo de interacciones de IA
- Duración del período de reinicio
Opciones de duración
Elija entre períodos de reinicio preestablecidos:
- 1 hora
- 6 horas
- 24 horas
- 7 días
- Duración personalizada (especificada en horas)
Monitoreo de uso
Visualización de estadísticas
Los administradores pueden monitorear el consumo de tokens y el consumo de uso en: https://SITENAME/admin/plugins/discourse-ai/ai-usage
- Navegue a
Admin > Plugins > Discourse AI - Seleccione la pestaña "Uso"
- Filtre por rango de fechas, grupo de usuarios o métricas específicas
Experiencia del usuario
Notificaciones de cuota
Los usuarios reciben comentarios claros cuando se acercan o alcanzan los límites de cuota:
- Estado de uso actual
- Tiempo hasta el próximo reinicio de cuota
Mensajes de error
Cuando se excede una cuota, los usuarios ven:
- Una notificación clara de que se ha alcanzado el límite de cuota
- El tiempo restante hasta su próximo reinicio de cuota
Mejores prácticas
- Comience de forma conservadora: comience con cuotas más bajas y ajústelas según los patrones de uso reales
- Asignación basada en grupos: asigne diferentes cuotas según las necesidades y roles de los grupos de usuarios
- Monitoreo regular: revise los patrones de uso para optimizar la configuración de cuotas
- Comunicación clara: informe a los usuarios sobre los límites de cuota y los períodos de reinicio
Problemas y soluciones comunes
Problema: Los usuarios alcanzan frecuentemente los límites
Solución: Considere:
- Aumentar los límites de cuota para grupos específicos
- Reducir el período de reinicio
- Crear grupos especializados para usuarios de alto uso
Problema: Cuotas no utilizadas
Solución:
- Ajuste los límites a la baja para optimizar la asignación de recursos
- Revise las asignaciones de grupos para garantizar que las cuotas coincidan con las necesidades de los usuarios
Preguntas frecuentes
P: ¿Se pueden suspender temporalmente las cuotas?
R: Sí, los administradores pueden deshabilitar temporalmente la aplicación de cuotas para grupos específicos o para todo el sitio.
P: ¿Las cuotas no utilizadas se acumulan?
R: No, las cuotas se reinician por completo al final de cada período.
P: ¿Pueden diferentes modelos LLM tener diferentes cuotas?
R: Sí, las cuotas se pueden configurar de forma independiente para cada LLM.
P: ¿Qué sucede si se establecen varias cuotas para un solo LLM?
R: Las cuotas se basan en el grupo y se aplican por usuario. Para que un usuario exceda la cuota, debe exceder la cuota en todos los grupos. Esto significa que si usted otorga a los administradores una cuota muy flexible y al nivel de confianza 1 una más restrictiva, se aplicará la cuota de administrador a los administradores.
P: ¿Qué sucede si no se aplica ninguna cuota a un LLM?
R: No sucederá nada especial, todo el uso de LLM no se medirá.
P: ¿Qué pasa si quiero diferentes cuotas para diferentes funciones?
R: Discourse AI le permite definir múltiples LLMs que se conectan al mismo endpoint e incluso pueden reutilizar claves. Si desea dar una cuota al asistente de IA y otra al bot de IA, defina 2 LLMs.


